setwd("~/Desktop/Kitab-II")
Vəsait Klassik Test Nəzəriyyəsinin və R statistik proqramının vasitəsilə test nəticələrinin təhlilinə həsr edilib. Testologiya elmindən bəhs edən ədəbiyyatları şərti olaraq üç qrupa bölmək olar. Birinci qrupa aid olan ədəbiyyatlarda testlərin və onları təşkil edən tapşırıqların tiplərindən, növlərindən, yazılma qaydalarından, tərtibindən, həmçinin testləşmənin aparılma prosedurıarından, ballaşdırma qaydalarından və sairə bu kimi proseslərdən bəhs edilir. İkinci qrup ədəbiyyatlarda əlavə olaraq test nəticələrinin qismən statistik təhlili də verilir. Bu zaman testlərə həm Klassik Test Nəzəriyyəsi həm də Müasir Test Nəzəriyyəsi paradiqmasında baxılır. Üçüncü qrup ədəbiyyatlarda nəticələrinin statistik təhlilini bilavasitə nümayış etdirmək üçün çox zaman hansısa bir proqramdan istifadə olunur. Son zamanlar bu sahədə proqram təminatı kimi R-proqramından daha geniş istifadə olunmağa başlanmışdır.
Bu vəsaiti də III qrup ədəbiyyata aid etmək olar. Təklif olunan bu vəsaitdə test nəticələrinin təhlilinə, Klassik Test Nəzəriyyəsi çərçivəsində, R-proqramının tətbiqilə baxılır.
Vəsaitdə verilən material müxtəlif mənbələrdən toplanmış və azərbaycan dilinə tərcümə edilmişdir. Bu mənbələrin adları müvafiq bölmələrin axırında verilmişdir. Materialın seçilməsi, düzülməsi və onların şərhləri müəllifə məxsusdur. Müəllifin test nəticələrinin analizi sahəsində kifayət qədər təcrübəsi vardır (MİQ-imtahanlarının və bəzi illərin buraxılış imtahanlarının təhlili).
Ölkəmizdə təhsil sahəsində istifadə olunan testlərin nəticələrinin elmi-statistik təhlilinə ciddi ehtiyacı nəzərə alaraq, həmin təcrübəni bölüşmək istəmişik. Vəsait azərbaycan dilində bu sahədə yazılan ilk ədəbiyyat olduğundan heç şübhəsiz, çoxsaylı qüsurları olacaqdır. Kitab bookdown-da yazılıb və biz onu ildə iki dəfə yeniləmək fikrindəyik. Ona görə də vəsait haqqında qeyd və iradlarınızı, məsləhət və tövsiyələrinizı mənim elektron ünvanıma (“talibovtariyel@gmail.com”) göndərməyinizi xaiş edirik.
R-proqramı haqda -Vəsaitdə olanların tam başa düşülməsi üçün R-proqramından və onun rstudio platformasından istifadəni bilməlisiz.
R-proqramından başqa, diqər statistika ilə əlaqəli proqramları (SPSS, Stata, Jmetrik) bilənlər də yaxud heç bir proqramla tanış olmayanlar da vəsaitdən bəhrələnə bilərlər. Belə ki KTN-nin əsas fərziyələri və onlardan çıxan çoxsaylı nəticələr mümkün qədər anlaşılan formada isbatları ilə verilmişdir.
Nəyə görə R-roqramı?
R-ın digər uyğun proqramlardan üstünlükləri:
R-a aid çoxlu sayda hazır paketlər var və onların sayı sürətlə artır;
R-ödənişsizdir, yəni bir çox statistik proqramlardan fərqli olaraq müftədir;
R-müxtəlif əməliyyat sistemlərində işləyə bilir;
R-a aid çoxlu sayda ədəbiyyat vardır.
Vəsaitin I bölməsində Klassik Test Nəzəriyyəsində geniş istifadə olunan diskret təsadüfü dəyişən haqda məlumat verilir. Diskret təsadüfü dəyişənlər üzərində əməllərdən (toplanması, vurulması), onların riyazi gözləmələri, dispersiya və covariasiyasının hesablanma qaydaları veriılmişdir.
II bölmədə Klassik Test Nəzəriyyəsinə (KTN) qısa giriş verilir. Burada KTN-nin ilkin aksiomları və bu aksiomlardan çıxan nəticələr və onların isbatları verilir.
III bölmədə müxtəlif üsullarla testin etibarlılığı tərifi və hesablanması qaydaları verilir.
IV bölmədə hər iki dəyişən interval, yaxud mütləq şkalada veriləndə Pirson korrelyasiya əmsalının hesablanma düsturu verilir. Dəyişənlərin ikisi də dixotomik (nominal şkalada) və biri dixotomik (nominal şkalada) digəri daha zəngin şkalada (interval, yaxud mütləq şkala) veriləndə Pirson korrelyasiya düstürunun sadələşdirilmiş formalarının çıxarışları verilir.
V bölmədə test ballarının iki müxtəlif şərhi üsulundan danışılır. Normaya yönəlmiş şərhdə istifadə olunan müxtəlif şkalaların alınması üsulları verilir. Süni surətdə törətdiyimiz üç müxtəlif səviyyəli testlərin (Asan, Orta və Çətin səviyyəli) cəm ballarının paylanmasının müqayisəsi bir neçə üsulla verilir və şərh olunur.
VI bölmə əsas bölmədir. Burada müxtəlif paketlərdən və konkret funksiyalardan istifadə edilməklə müxtəlif testlər və onların tapşırıqları KTN-i çərçıvəsində analiz edilir.
VII bölmədə yuxarıda qeyd olunan üç səviyyəli testlərin (Asan, Orta və Çətin səviyyəli) törədilməsi prosedurları verilmişdir. Bu bölmə bizim baxdığımız KTN-i paradiqmasından kənara çıxır.
Bu bölməni mənimsədikdən sonra aşağıdakıları biləcək və etməyi bacaracaqsınız:
Diskret təsadüfü dəyişən nədir;
Diskret təsadüfü dəyişənin hadisələr fəzası və qiymətlər çoxluğu nədir;
Diskret təsadüfü dəyişənin paylanma qanununu və onun verilməsi üsullarını;
Diskret təsadüfü dəyişənin riyazi gözləməsinin, standart yayınmasının tapılmasını;
Diskret təsadüfü dəyişənlər üzərində əməlləri, onların toplanmasının və vurulmasının tapılmasını;
Təsadüfü sınaqların nəticəsində heç də həmişə ədədlər bir başa alınmır. Məsələn, qəpik pulun bir dəfə atılmasından alınan hadisələr fəzası S = {Gerb, Qəpik} iki hadisədən (haldan) ibarətdir, “Gerb” -üzünün düşməsi hadisəsi, yaxud “Qəpik” -üzünün düşməsi hadisəsi.
Statistik metodlar isə əsasən, rəqəmlərlərlə işlədiyindən hadisələr fəzasını hansı bir yollasa riyaziləşdirmək lazım gəlir. Bu riyaziləşmə prosesi isə təsadüfü dəyişən anlayışının daxil edilməsini tələb edir.
Tərif. Hadisələr fəzası \(S\) olan təsadüfü sınağa baxaq. Təyin oblastı \(S\)-hadisələr fəzası, qiymətlər çoxluğu \(R\)- həqiqi ədədlər çoxluğundan olan hər bir funksiyaya \(S\)-hadisələr fəzasında verilmiş (təyin edilmiş) həqiqi təsadüfü funksiya yaxud, həqiqi təsadüfü dəyişən deyilir.
Qiymətlər oblastı diskret olan təsadüfü dəyişənə diskret təsadüfü dəyişən deyilir. Klassik Test Nəzəriyyəsində (KTN) əsasən, diskret təsadüfü dəyişənlərlə qarşılaşırıq. Diskret təsadüfü dəyişənin nə olduğunu bir misal üzərində izah etməyə çalışaq:
Misal. Bir qəpik pulun atılmasından alınan hadisələr fəzası \(\Omega=\{G,Q\}\) kimi işarə edək. Burada {Q} hadisəsi pulun “qəpik” üzünün düşməsi hadisəsini, {G} hadisəsi “gerb” üzünün düşməsi hadisəsini göstərir. Biz, təsadüfü dəyişən kimi, \(X\)-i məsələn, belə təyin edə bilərik, \(X(G) = 1\), \(X(Q) = 0\). Yəni, pulun gerb üzü yuxarı düşəndə bizim təsadüfü dəyişənimiz bir qiymət alsın, qəpik üzü yuxarı düşəndə bizim təsadüfü dəyişənimiz sıfır qiymət alsın. Aydındır ki, belə təyin olunmuş təsadüfü dəyişən, bu hadisələr fəzasında təyini mümkün olan funksiyalardan yalnız biridir. Məsələn, təsadüfü dəyişən kimi biz əksin də götürə bilərik. Yəni elə funksiyaya baxarıq ki, qəpik üzü düşəndə bir qiymət alsın, gerb üzü düşəndə sıfır qiymətini alsın. Hadisələr fəzasında elementar hadisələrin sayı çox olduqca belə təsadüfü dəyişənlərin düzəlməsi imkanları da sürətlə artır.
Əgər, bizim baxdığımız hadisələr fəzası 5 dənə qəpik pulun eyni zamanda atılmasından, yaxud bir qəpik pulun beş dəfə dalbadal atılmasından alınan hadisələr fəzası olarsa, onda bu hadisələr fəzası \({2^5} = 32\)-elementdən ibarət olardı.
Bu fəzadan bir elementə baxaq. Məsələn, {QQGGQ}-hadisəsinə . Onda, bizim təyin etdiyimiz \(X\)-təsadüfü dəyişəninin (elementdəki gerblərin sayını bildirən funksiya) bu elementdə aldığı qiymət \(X(QQGGQ) = 2\)-olar. Yəni, baxdığımız bu nəticədəki gerb üzlərinin sayı ikidir.
Göründüyü kimi, belə təyin edilmiş \(X\)-təsadüfü dəyişəninin, təyin oblası 32 elementdən, qiymətlər çoxluğu 6 elementdən ibarətdir {0, 1, 2, 3, 4, 5}. Yəni, hadisələr fəzasında “Gerb”-lərin sayı sıfırdan beşə kimi hər bir qiyməti ala bilir.
\(X\)-təsadüfü dəyişəninin qiymətlər çoxluğundan hər bir ədədi hansı ehtimalla ala bildiyni klassik ehtimal nəzəriyyəsi ilə hesablaya bilrik :
\(P(X = 0)\), \(P(X = 1)\), \(P(X = 2)\), \(P(X = 3)\), \(P(X = 4)\)\(, P(X = 5)\) olan hadisələri seçək:
Bütün hadisələr fəzası, yəni bir qəpik pulun 5 dəfə atılmasından alınan nəticələr belə olur: {QQQQQ},{GQQQQ}, {QGQQQ}, {QQGQQ}, {QQQGQ}, {QQQQG},{GGQQQ}, {GQGQQ}, {GQQGQ}, {GQQQG},{QGGQQ}, {QGQGQ}, {QGQQG}, {QQGGQ}, {QGQGG}, {QQGQG},{QQGGG}, {QGQGG}, {QGGQG}, {QGGGQ},{GQQGG}, {GQGQG}, {GQGGQ}, {GGQQG}, {GQGQQ}, {GGQGQ},{QGGGG}, {GQGGG}, {GGQGG}, {GGGQG}, {GGGGQ},{GGGGG}.
Qəpik pulu ideal formada qəbul etsək bu hadisələrin hər birinin başvermə ehtimalı eyni olar. Cəmi 32 mümkün nəticə ola bildiyindən belə bir hadisənin başvermə ehtimalı \(\frac{1}{32}\) olar.
Bir qəpik pulun atılmasında iki üzdən birinin düşməsi ehtimalın \(\frac{1}{2}\)-kimi qəbul edək. Yəni, \(P(G) = \frac{1}{2}\) və \(P(Q) = \frac{1}{2}\).
Onda, asılı olmayan hadisələrin birgə baş verməsi ehtimalı onların ehtimalları hasilinə bərabər olduğunu nəzərə alsaq, \(P(QGGGG) = P(Q)P(G)P(G)P(G)P(G) = (1 - \frac{1}{2})(\frac{1}{2})(\frac{1}{2})(\frac{1}{2})(\frac{1}{2}) = (\frac{1}{2})^5 = \frac{1}{32}\)
Bizim halda, \[P(G) = \frac{1}{2} = 1 - \frac{1}{2} = P(Q) \] olduğundan 32 elementar hadisənin hər birisinin baş vermə ehtimalı, \(\frac{1}{32}\) olur.
Beləliklə, \(P(X = 0)\)-yalnız, bir elementar hadısədə \({QQQQQ}\) olduğundan, \(P(X = 0) = \frac{1}{32}\).
\(P(X = 1)\), altı elementar hadisədə baş verir \(P(X = 1) = P(GQQQQ) + P(QGQQQ) + P(QQGQQ) + P(QQQGQ) + P(QQQQG) = \\\frac{1}{32}+ \frac{1}{32} + \frac{1}{32} + \frac{1}{32} + \frac{1}{32} = \frac{5}{32}\)
Həmin qayda ilə hesablasaq
\[P(X = 0) = \frac{1}{32}\]
\[P(X = 1) = \frac{5}{32}\]
\[P(X = 2) = \frac{10}{32}\]
\[P(X = 3)= \frac{10}{32}\]
\[P(X = 4)= \frac{5}{32}\]
\[P(X = 5) = \frac{1}{32}\]
\[P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = \\ \frac{1}{32} + \frac{5}{32} +\frac{10}{32} + \frac{10}{32} + \frac{5}{32} +\frac{1}{32} = 1\] alarıq.
Beləliklə, \[{P(X=k)}\geq 0, (k = 0, 1, 2, 3, 4, 5) \]
və \[\Sigma_{k}{P(X=k)} = 1, (k = 0, 1, 2, 3, 4, 5) ~~ (1.2)\]
Baxdığımız halda alınan təsadüfü dəyişənin bu iki xassəsini digər diskret təsadüfü kəmiyyətlərə də şamil etmək olur. Yəni, \(X\)-ixtiyari diskret təsadüfü kəmiyyətdirsə və \({k}\)-onun aldığı qiymətlər çoxluğudursa, \[{P(X=k)}\geq 0 ~~ (1.)\] və \[\Sigma_{k}{P(X=k)} = 1~~ (1.2)\] olur.
İlk baxışda adama elə gəlir ki, diskret təsadüfü dəyişəni vermək üçün onun qiymətlər çoxluğunu vermək kifayətdir. Lakin, bu belə deyil, təsadüfü dəyişən öz qiymətlərini müxtəlif ehtimallarla ala bilər. Bu səbəbdən, diskret təsadüfü dəyişəni tam vermək üçün onun qiymətlər çoxluğunu və bu qiymətləri hansı ehtimallarla aldığını vermək lazım gəlir. Diskret təsadüfü dəyişənin qiymətlər çoxluğu və onların alınması ehtimalları arasındakı əlaqəyə diskret təsadüfü dəyişənin paylanma qanunu deyilir.
Diskret təsadüfü dəyişənin paylanma qanunu cədvəl, düstur və qrafik üsulla vermək olur.
| \(X\) | \(x_{1}\) | \(x_{2}\) | \(\cdots\) | \(x_{n}\) |
|---|---|---|---|---|
| \(P\) | \(p_{1}\) | \(p_{2}\) | \(\cdots\) | \(p_{n}\) |
Ümumiyyətlə, təsadüfü dəyişənlərin, xüsusi halda diskret təsadüfü dəyişənlərin üzərində müxtəlif əməllər aparmaq olur.
Bir diskret təsadüfü dəyişənin qiymətlər çoxluğuna eyni bir ədədi əlavə etdikdə, yeni qiymətlərin alınması ehtimalları dəyişmir.
Bir diskret təsadüfü dəyişənin qiymətlər çoxluğunu eyni bir müsbət ədədə vurduqda, yeni qiymətlərin alınması ehtimalları dəyişmir.
İki təsadüfü dəyişənin cəminə və hasilinə də baxa bilərik.
Tutaq ki, bizim iki \(X_{1}\) və \(X_{2}\)-kimi cədvəl formasında verilmiş iki diskret təsadüfü dəyişənimiz vardır.
| \(X_{1}\) | \(-1\) | \(0\) | \(1\) | \(2\) |
|---|---|---|---|---|
| \(P_{X_{1}}\) | \(0.1\) | \(0.3\) | \(0.4\) | \(0.2\) |
| \(X_{2}\) | \(-1\) | \(3\) | \(2\) |
|---|---|---|---|
| \(P_{X_{2}}\) | \(0.2\) | \(0.3\) | \(0.5\) |
Bu iki təsadüfü dəyişənin qrafik təqdimi də aşağıdakı kimi olar
| X_1 | P_1 |
|---|---|
| -1 | 0.1 |
| 0 | 0.3 |
| 1 | 0.4 |
| 2 | 0.2 |
\(X_{1}\)-dəyişəni üçün, ehtimallar cəmi, \(0.1 + 0.3 + 0.4 + 0.2 = 1\) və
\(X_{2}\)-dəyişəni üçün, ehtimallar cəmi, \(0.2 + 0.3 + 0.5 = 1\) olduğundan əsas şərtimiz ödənir.
İndi isə bu iki diskret təsadüfü kəmiyyətin cədvəl formasında verilən paylanma qanunlarından istifadə edərək onların cəmlərindən və hasillərindən əmələ gələn diskret təsadüfü kəmiyyətlərin paylanma qanunların cədvəl formasında verək
Əvvəlcə cəm diskret təsadüfü kəmiyyətin, yəni \(X_{1} + X_{2}\)-nin aldığı qiymətlər çoxluğunu tapaq. Bu çoxluq \(X_{1}\) və \(X_{2}\)-nin qiymətlərinin bütün mümkün cəmlərindən ibarət oluir.
Bütün mümkün qiymətlər çoxluğu \(-2, -1, 0, 1, 2, 3, 4, 5\)-kimidir. Burada, cəm diskret təsadüfü kəmiyyət \(-2, -1, 0, 5\)-qiymətlərini bir dəfə, lakin \(1, 2, 3, 4\)-qiymətlərini iki dəfə alır. Bu səbəbdən, məsələn, \(-2 = -1 + (-1)\), yəni \(X_{1}\)-diskret təsadüfü kəmiyyəti \(-1\) və \(X_{2}\)-diskret təsadüfü kəmiyyətlərin \(-1\)-də aldıqları müvafiq ehtimallar bir birlərinə vurulur. \(0.1*0.2 = 0.02\).
Aşağıdakı cədvəldə cəm diskret təsadüfü kəmiyyətin qiymətlər oblastını hər bir qiymətini alma ehtimalı verilmişdir. Cəm diskret təsadüfü kəmiyyət eyni qiyməti bir neçə halda alırsa müvüviq ehtimalları toplamaq lazım gəlir. Məsələn, \(2 = -1 + 3\) və \(2 = 0 + 2\) olduğundan birinci hadisənin başvermə ehtimalı \(0.1*0.3= 0.03\), ikinci hadisənin başvermə ehtimalı \(0.3*0.5 = 0.15\)-olur. Nəticədə, cəm diskret təsadüfü kəmiyyətin \(2\)-qiymətini alma ehtimalı bu iki ehtimalın cəminə \(0.18\)-ə bərabər olur.
| \(X_{1}+X_{2}\) | \(-2\) | \(-1\) | \(0\) | \(1\) | \(2\) | \(3\) | \(4\) | \(5\) |
|---|---|---|---|---|---|---|---|---|
| \(P({X_{1}}+X_{2})\) | \(0.02\) | \(0.06\) | \(0.08\) | \(0.09\) | \(0.18\) | \(0.29\) | \(0.22\) | \(0.06\) |
Cəm diskret təsadüfü dəyişənin paylanmanın əsas şərtini ödədiyini yoxlayaq.
P = c(0.02, 0.06, 0.08, 0.09, 0.18, 0.29, 0.22, 0.06)
sum(P)
## [1] 1
Cəm diskret təsadüfü dəyişənin qrafik üsulla verilməsi
Bu qayda ilə ixtiyari iki diskret (sonlu) təsadüfü dəyişənin hasılini də tapa bilərik
İndi tutaq ki, 5 tapşırıqdan ibarət bir testimiz vardır. Test dixotomik tapşırıqlardan ibarətdir və tapşırığa doğru cavab verildikdə o bir balla, səhv cavab verildikdə sıfır balla qiymətləndirilir. Əgər, diqqətlə baxsaq, belə testin nəticəsində alınan cavab balları təsadüfü dəyişən kimi, yuxarıda baxdığımız qəpik pulun 5 dəfə atılmasından düzəldilən təsadüfü dəyişənlə demək olar ki eynidir. Fərq hadisələrin başvermə ehtimallarındadır. Biz qəpik pulu ideal qəbul etdiyimizdən hər bir üzünün düşmə ehtimalını \(\frac{1}{2}\)-kimi götürürük. Test halında isə hər dəfə yeni tapşırıq olur və onlara doğru cavabın verilməsi ehtimalı tapşırığın çətinlik dərəcəsindən və imtahan verənlərin hazırlıq səviyyələrindən asılı olaraq dəyişir.
Belə bir testlə imtahan verənin bir bal almaq ehtimalını hesablayaq. \(D\)-tapşırığa doğru cavabın verilməsi hadisəsini, \(Y\)-tapşırığa doğru olmayan cavabın verilməsi hadisəsini işarə edək. \(DYYYY\)-hadısəsi, 5 tapşırıqdan birincisinə doğru, qalanlarına doğru olmayan cavabların verilməsi halıdır. \(YYYDY\)-hadısəsi, 5 tapşırıqdan dördüncüyə doğru, qalanlarına doğru olmayan cavabların verilməsi hadisəsidir və sairə. Uyğun olaraq, \(P(DYYYY)\) beş tapşırıqdan birincisinə doğru, qalanlarına doğru olmayan cavabların verilməsi hadisəsinin ehtimalıdır. Onda, testin bir sualına doğru, qalanlarına doğru olmayan cavablar verilən hadısələrin ümumi ehtimalı, başqa sözlə, bizim təsadüfü dəyişənin bir qiyməti aldığı hadısələrin ehtimalları cəmi aşağıdakı kimi hesablanar.
\(P(X = 1)\), altı elementar hadisədə baş verir \[P(X = 1) = P(D_{1}Y_{2}Y_{3}Y_{4}Y_{5}) + P(Y_{1}D_{2}Y_{3}Y_{4}Y_{5}) + \\ P(Y_{1}Y_{2}D_{3}Y_{4}Y_{5}) + P(Y_{1}Y_{2}Y_{3}D_{4}Y_{5}) + P(Y_{1}Y_{2}Y_{3}Y_{4}D{5}) = \\ P(D_{1})(1 - P(D_{2}))(1 - P(D_{3}))(1 - P(D_{4}))(1 - P(D_{5}))+\\ (1 - P(D_{1})) P(D_{2})(1 - P(D_{3}))(1 - P(D_{4}))(1 - P(D_{5}))+\\ (1 - P(D_{1}))(1 - P(D_{2}))P(D_{3})(1 - P(D_{4}))(1 - P(D_{5}))+\\ (1 - P(D_{1}))(1 - P(D_{2}))(1-P(D_{3}))P(D_{4})(1 - P(D_{5}))+\\ (1 - P(D_{1}))(1 - P(D_{2}))(1-P(D_{3}))(1-P(D_{4}))P(D_{5})\]
Tapşırıqlar dixotomik olduğundan, məsələn ikinci tapşırığa doğru cavabın ehtimalı \(P(D_{2})\)-olduqda doğru olmayan cavabın ehtimalı \(1 - P(D_{2})\) olur.
Əgər, bizə iştirakçıların hər bir tapşırığa doğru cavabın verməsi ehtimalı məlum olarsa, biz bu iştirakçıların neçə bal toplaması ehtimalını qeyd olunan yolla tapa bilərik. Lakin, tapşırığa cavabvermə ehtimalını tapmaq üçün, eyni tapşırıqlar eyni iştirakçılara çoxlusayda verilə bilmir. Ona görə də konkret tapşırığa müəyyən ümumi yığımın cavabvermə ehtimalını tapmaq üçün həmin tapşırıq bu ümumi yığımın kifayət qədər geniş və təmsiledici alt yığımında (keçiriləcək imtahan şərtləri eyni qalmaqla) sınaqdan keçirilməlidir. Yalnız, bu yolla imtahanın məqsədinə müvafiq keyfiyyətə malik testlər qurmaq mümkündür.
Hər bir \(X_{i}\) diskret təsadüfü dəyişənlə əlaqəli riyazi gözləmə deyilən, təsadüfü olmayan bir kəmiyyət düzəltmək olur. \[E[X_{i}] = \sum_{i}^{N}p_{i}x_{i}\] Burada, \(x_{i}\)-təsadüfü dəyişənin aldığı qiymətlər, \(p_{i}\) təsadüfü dəyişənin hımin qiymətləri alma ehtimallarıdır. Məsələn, qəpik pul bir dəfə atıldıqda, yuxarıda təyin etdiyimiz təsadüfü dəyişənin riyazi gözləməsini tapaq. Bizim dəyişənimiz iki qiymət alır. Bir və sıfır. Yəni, gerb üzü yuxarı düşəndə dəyişənimiz bir, qəpik üzü yuxarı düşəndə dəyişənimiz sıfır qiymətin alır. Hər iki hadisənin başvermə ehtimalı \(\frac{1}{2}\)-olduğundan, bu təsadüfü dəyişənin riyazi gözləməsi \[E[X] = \sum_{i=1}^{N}p_{i}x_{i} = 1*\frac{1}{2} + 0*\frac{1}{2} =\frac{1}{2}\] olur.
Tutaq ki, \[X_{1}, X_{2}, \dots, X_{n}\] başvermə ehtimalları \[P(X_{1}), P(X_{2}), \dots, (X_{n})\] və \[Y_{1}, Y_{2}, \dots, Y_{n}\] başvermə ehtimalları \[P(Y_{1}), P(Y_{2}), \dots, (Y_{n})\] olan təsadüfü kəmiyyətlərdir.
Onda, \(X\)- təsadüfü kəmiyyətinin riyazı gözləməsi \(E[X]\) kimi işarə edilir və \[E[X] = \sum_{i}^{n}X_{i}*P(X_{i}) ~~~ (1)\] kimi hesablanır.
Uzunluqları eyni olan iki \(X\) və \(Y\) təsadüfü kəmiyyətlərin covariansı \(Cov(X,Y)\)-kimi işarə olunur və \[Cov(X,Y) = E[(X - E[X])*(Y - E[Y])]\] kimi hesablanır.
Covariasiya bəzən dispersiya kimii \(\sigma_{XY}\), yaxud \(\sigma(XY)\) kimi də işarə edilir.
Riyazi gözləmənin xəttilik xassəsindən istifadə edərək, covariansın ifadəsini sadələşdirmək olur. \[Cov(X,Y) = E[(X - E[X])(Y - E[Y])] \\ = E[XY - XE[X] - E[X]Y + E[X]E[Y]] \\ = E[XY] - E[X]E[Y] - E[X]E[Y] + E[X]E[Y] \\ = E[XY] - E[X]E[Y]\]
Əgər, \(X,Y\)- kəmiyyətləri, \((x_{i},y_{i}\) qiymətlərini eyni \(1/n\) ehtimalı ilə alan diskret təsadüfü kəmiyyətlərdirsə, onda \(Cov(X,Y)\) X və Y-in riyazi gözləmələri ilə aşağıdakı kimi ifadə olunur. \[Cov(X,Y) = \frac{1}{n}\sum_{i=1}^{n}(x_{i} - E[X])(y_{i}-E[Y]) \]
Əgər, \(E[X]= \frac{1}{n}\sum_{i=1}^{n}x_{i}\), \(E[Y]= \frac{1}{n}\sum_{i=1}^{n}y_{i}\) olduğunu nəzərə alsaq, covariasiya düstruru aşağıdakı şəklə düşər. \[Cov(X,Y) = \frac{1}{n^2}\sum_{i=1}^{n}\sum_{j=1}^{n}\frac{1}{2}(x_{i}-x_{j})(y_{i}-y_{j}) \\ = \frac{1}{n^2}\sum_{i=1}^{n}\sum_{j>i}(x_{i}-x_{j})(y_{i}-y_{j})\]
Ümumi halda, əgər \((X,Y)\) diskret təsadüfü dəyişənləri, \((x_{i},y_{i})\) cütlərini \(p_{i}\)-ehtimalları ilə alırsa, onda \[Cov(X,Y) = \sum_{i=1}^np_{i}(X_{i}- E[X])(Y_{i}- E[Y])\] kim olar.
Təsadüfü dəyişənin öz-özünə covariasiyası dispersiyanı (variasiyanı) verir.
\[Cov(X,X) = Var(X,X) = \sigma^2(X) = \sigma_{X}^2\]
\(X_{1}, X_{2}, \dots, X_{n}\) təsadüfü kəmiyyətləri və \(a_{1}, a_{2}, \dots, a_{n}\)- həqiqi ədədləri üçün \[\sigma(\sum_{i=1}^{n}a_{i}X_{i})=\\\sum_{i,j=1}^{n}a_{i}a_{j}\sigma_{X_{i}X_{j}} = \\ \sum_{i=1}^{n}a_{i}^2\sigma^2(X_{i}) + 2\sum_{i,j:i<j}a_{i}a_{j}\sigma_{X_{i}X_{j}}\]
Əgər, \(X\) və \(Y\) asılı olmayan təsadüfü kəmiyyətlərdirsə, onda \[ E[XY] = E[X]E[Y]\] olur.
Yəni, iki asılı olmayan təsadüfü kəmiyyətlərin hasilinin riyazi gözləməsi onların riyazi gözləmələri hasilinə bərabər olur. Bu faktın tərsi doğru deyildir. Yəni, iki təsadüfü kəmiyyətin hasilinin riyazi gözləməsi onların riyazi gözləmələri hasilinə bərabərdirsə, buradan onların asılı olmaması faktı çıxmır.
Istifadə olunan ədəbiyyat:
“Теория вероятностей и математическая статистика. В.Е.Гмурман.”
“Теория вероятностей и математическая статистика. Кремер Н.Ш”
Bu bölməni mənimsədikdən sonra aşağıdakıları biləcək və etməyi bacaracaqsınız:
Klassik Test Nəzəriyyəsinin əsas fərziyələrini;
Ölçmənin səhv kompanentinin nə olduğunu;
Sistematik səhvi;
Təsadüfü səhvi;
Klassik Test Nəzəriyyəsinin əsas fərziyələrindən çıxan nəticələri və onların isbatlarını.
Hər bir imtahan balına təsadüfü kəmiyyət kimi baxmaq olur. Belə ki, testin nəticəsinə bir çox şeylər təsir göstərir. Testləşmədə iştirak edənin diqqətsizliyi, cavabların doğru və yaxud yalan təxminedilməsi, imtahan keçirilən məkandakı şərait və dıgər faktorlar imtahanın nəticəsinə öz təsirini göstərir.
Fərz ədək ki, bir iştirakçıya eyni bir test təkrar-təkrar, dəfələrlə təqdim edilir. İştirakçıya hər dəfə test veriləndə onun ölçülən sahə üzrə biliyi əvvəlki testləşmələrdə olduğu kimi qalır və yalnız, test tapşırıqlarında tələb olunanlar tam unudulmuş olur.
Aydındır ki, hər dəfə testləşmənin nəticəsində iştirakçının müşahidə olunan balı yuxarıda qeyd olunanlardan və digər bu kimi diğər səbəblərdənm dəyişə bilir. Prosesı hər dəfə təkrarlasaq bir müşahidə olunan bal alarıq.
Fərz edək ki, prosesi çoxlu sayda təktrarlayırıq və hər dəfə iştirakçının aldığı balı Xi kimi işarə edirik. Bu balların E(Xi)- ədədi ortalarının limitinə bu iştirakçının, bu konkret test üzrə həqiqi balı deyilir və \[T_{i} = E\left(X_{i}\right) \] kimi yazılır. Aydındır ki, hər bir konkret iştirakçının, konkret test üzrə həqiqi balı bir konkret ədəd edir. Başqa sözlə iştirakçının konkret test üzrə həqiqi balı təsadüfü kəmiyyət olmur.
Biz yuxarıda iki kəmiyyət təyin etdik. Hər bir testləşmədə, yəni hər bir seansda iştirakçının aldığı, topladığı yaxud, nümayiş etdirdiyi bu və ya digər səbəbdən dəyişəbilən, yəni təsadüfü kəmiyyət olan müşahıdə olunan balı Xi və onun bu konkret test üzrə dəyişməyən, sabit qalan, Ti həqiqi balı.
Hər bir seansda öıçmənin səhvi olaraq, müşahıdı olunan balın hıqiqi baldan nə qədər fərqli olduğuna baxılır. Beləliklə, pedaqoji ölçmə nəzəriyyəsində səhv bal, yaxud ölçmənin xətası statistik kəmiyyət olub müşahidə olunan balın həqiqi baldan yayınmasını xarakterizə edən kəmiyyətdir.
Hər bir ölçmənin müxtəlif növ səhvləri arasında iki vacib növünə baxılır: sistematik səhv və təsadüvü səhv.
Sistematik səhvlərə əsasən, testin özünün keyfiyyət qüsurları, keçirilmə şəraitindəki uyğunsuzluqlar və sairə bu kimi testi tərtib edənlərin və keçirilməsinə cavabdeh olanların etdikləri səhvlər aid edilir.
Təsadüfü səhvlər isə daha şox iştirakçıların özlərini aparma xüsusiyyətlərindən yaranan səhvlərdir. İmtahan prosesində iştirakçı özünü pis hiss edə bilər. İştirakçının qorxu hissi, həyacanı, darıxması, imtahan keçirilən məkanın istiliyi, soyuqluğu, səsli-küylü olması və s. nəticələrə təsir edən təsadüfü faktorlardır.
Bütövlükdə isə testləşmə prosesində ölçmənin səhvi iştirakçının həqiqi balını ya artırmaqla, ya da azaltmaqla müşahıdə edilən ballarda öz təsirini göstərir.
Beləliklə, Klasssik Test Nəzəriyyəsində Müşahıdə olunan bal, həqiqqi bal və səhv komponent arasındakı münasıbəti aşağıdakı bərabərlikdəki kimi ifadə etmək olur.
\[ X_{i} = T_{i} + E_{i} \]
Burada indeks i – iştirakçının nömrəsi, Xi onun testin nəticəsində aldığı bal, yəni müşahidə edilən bal, Ti – bu iştirakçının həqiqi balı, Ei isə ölçmənin səhvidir. Iştirakçının həqiqi balı Ti – yə dəyişməz, sabit kimi baxılır. Qalan iki kompanent isə təsadüfü kəmiyyət olub, bir-birlərindən əlaqəli formada dəyişir. Yəni, birinin necə dəyişdiyini bilsək digərini tapa bilərik.
Burada əsas sual, müşahidə olunan balla həqiqi bal arasında əlaqənin sıxlığını müəyyən etməkdir. Bu əlaqənin sıxlığını nümayış etdirən göstəricilərdən biri onlar arasındakı korrelyasıyadır.
KTN-nin yaradıcısı ingilis psixoloqu, faktor analizin banisi Çarlz Edvard Spirmen hesab edilir.
KTN-in hər tərəfli və tam şərhi birinci dəfə Horald Qulliksenin hələ 1950-ci ildə çap edilmiş fundamental kitabında verilmişdir
Klassik Test Nəzəriyyəsi aşağıdakı 5 fərziyəyə əsaslanır:
\[ X = T + E ~~~ (1) \]
T və E çox vaxt məlum olmur. Bu fərziyədə deyilir ki, testin nəticəsində alınan çiy bal, yaxud müşahıdə olunan bal, iki kompanentdən ibarətdir. T-həqiqi bal, yaxud doğru bal (true score) və E-ölçmənin səhv balı (error score). Məsələn, bir nəfərin İQ-testindən həqiqi balı 110-dursa və o testdən 105 bal alıbdırsa onda onun müşahidə olan balı, \(105 = 110-5\) olur. Bu zaman ölçmənin səhv kompanenti -5 olur. Əgər, onun müşahidə olunan balı 117-dirsə onda \(117 = 110 + 7\) olduğundan bu ülçmənin səhv kompanenti \(E = 7\) olur.
Beləliklə, klassik “həqiqi-bal” (true-score) test nəzəriyyəsində həqiqi bal və ölçmənin səhv balı sadəcə oplaraq toplanır. Qeyd edək ki, digər additiv və faktor analiz kimi ölçmə nəzəriyyələri də vardır.
Bu tərifdən həm də görünür ki, həqiqi bala imtahan verənin bir mütləq balı kimi baxılmır, iştirakçının o balı təklif edilən konkret testdən asılı olur.
\[ T = E(X) ~~~ (2) \]
\[ r_{T,E} = 0 ~~~ (3) \]
Bu fərziyə nəzəriyyənin sonrakı inkişafı üçün çox vacibndir. Burada deyili ki, hər hansı bir testi verən müxtəlif səviyyəli adamların ballarının sistematik səhv komponenti olmur. Bu şərt o vaxt pozula bilir ki, məsələn sinifdə pis hazırlıqlı şagirdlər yaxşı hazırlıqlı şagirdlərdən köçürürlər yaxud onlara köməklik olunur və sairə. Belə hallar həqiqi balla, səhv bal arasında mənfi korrelyasiya yaradır.
\[ r_{E_1,E_2} = 0 ~~~ (4) \]
\[ r_{E_1,T_2} = 0~~~ (5) \]
Bunlardan əlavə KTN-də daha iki tərif verilir
\[ T1 = T2,~~ D1 = D2~~~ (6) \]
\[ T1 = T2 + C12~~~(7) \] Burada, C12 – sabitdir. Yəni, ekvivalent testlərdə paralellik şərtindən əlavə, həqiqi ballar bir-birlərindən bir sabit toplanan qədər fərqlənirlər.
Əgər, yuxarıda sadalanan fərziyələr (müddüalar) doğru olarsa, onda onlardan istifadə edilərək çoxlu sayda nəticələr əldə etmək mümkündür. Aşağıda, həmin nəticələr və onların isbatı verilmişdir.
Burada, orta mötərizənin içərisindəki səhv kompanentin işarəsidir.
İsbatı: \[X = T + E \\ E[X] = E[T + E] \\ E[X] = E[T] + E[E]\]
Ikinci fərziyəyə görə, \[E[X] = E[T]\] Onda, buradan çıxır ki, \[E[E] = 0\]
İsbatı: \[E[ET] = \\ E[ET] - 0 = \\ E[ET] - E[E]E[T] = \\Cov(ET) = \\ \sigma_{ET}\] buradan, \[\rho_{ET} = \frac{\sigma_{ET}}{\sigma_{E}\sigma_{T}} = 0\]
İsbatı: \[\sigma_{X}^2 = \sigma_{T + E}^2 = \\\sigma_{T}^2 + \sigma_{E}^2 + 2\sigma_{TE}^2 =\\\sigma_{T}^2 + \sigma_{E}^2 \]
İsbatı: \[\rho_{XT}^2 = [\frac{\sigma_{XT}}{\sigma_{X}\sigma_{T}}]^2 = \\ [\frac{E[XT] - E[X]E[T]}{\sigma_{X}\sigma_{T}}]^2 = \\ [\frac{E[(T + E)T] - E[X]E[T]}{\sigma_{X}\sigma_{T}}]^2 = \\ [\frac{E[T^2] + E[TE] - E[T]^2}{\sigma_{X}\sigma_{T}}]^2 = \\ [\frac{\sigma_{T}^2}{\sigma_{X}\sigma_{T}}]^2 = \\ \frac{\sigma_{T}^2}{\sigma_{X}^2}\]
İsbatı: \[\sigma_{X}^2 = \sigma_{T}^2 + \sigma_{E}^2\] Buradan çıxır ki, \[\sigma_{T}^2 = \sigma_{X}^2 - \sigma_{E}^2 \] hər iki tərəfi \(\sigma_{X}^2\)-ə bölsək, \[\rho_{XT}^2 = 1 - \frac{\sigma_{E}^2}{\sigma_{X}^2}\]
Beləliklə, kimsə paralel testlər tərtib edibdirsə, onlar üçün bu verilən şərt ödənilməlidir.
İsbatı:\[\sigma_{X^1}^2 = \sigma_{T^1}^2 + \sigma_{E^1}^2 = \\ \sigma_{T}^2 + \sigma_{E}^2 = \\ \sigma_{X}^2\]
İsbatı: \[\rho_{XY} = \\ \frac{\sigma_{XY}}{\sigma_{X}\sigma_{Y}} = \\ \frac{\sigma_{(T + E)Y}}{\sigma_{X}\sigma_{Y}} \\ \frac{\sigma_{TY} + \sigma_{EY}}{\sigma_{X}\sigma_{Y}} = \\ \frac{\sigma_{TY}}{\sigma_{X}\sigma_{Y}} = \\ \frac{\sigma_{T^1Y}}{\sigma_{X^1}\sigma_{Y}} = \\ \rho_{X^1Y}\]
İsbatı:\[\rho_{XX^1} = \frac{\sigma_{XX^1}}{\sigma_{X}\sigma_{X^1}} = \\ \frac{\sigma_{(T + E)(T^1 + E^1)}}{\sigma_{X}^2} = \\ \frac{\sigma_{TT^1} + \sigma_{ET^1} + \sigma_{TE^1} + \sigma_{EE^1}}{\sigma_{X}^2} = \\ \frac{\sigma_{T}^2}{\sigma_{X}^2}= \\ \frac{\sigma_{T^1}^2}{\sigma_{X^1}^2} \]
İsbatı: \[\rho_{XX^1} = \frac{\sigma_{T}^2}{\sigma_{X}^2} = \\ \frac{\sigma_{X}^2 - \sigma_{E}^2}{\sigma_{X}^2} = \\ 1 - \frac{\sigma_{E}^2}{\sigma_{X}^2} \]
İsbatı:\[\rho_{XE}^2 = [\frac{\sigma_{XE}}{\sigma_{X}\sigma_{E}}]^2 = \\ \frac{(\sigma_{TE} + \sigma_{E}^2)^2}{\sigma_{X}^2\sigma_{E}^2} = \\ \frac{(\sigma_{E}^2)^2}{\sigma_{X}^2\sigma_{E}^2} = \frac{\sigma_{E}^2}{\sigma_{X}^2}\] Buradan, \[\rho_{XX^1} = 1- \frac{\sigma_{E}^2}{\sigma_{X}^2}\] olduğundan, \[\rho_{XX^1} = 1 - \rho_{XE}^2\]
İsbatı: İsbat (4)-ə görə, \[\rho_{XT}^2 = \frac{\sigma_{T}^2}{\sigma_{X}^2}\] İsbat (8)-ə görə, \[\frac{\sigma_{T}^2}{\sigma_{X}^2} = \rho_{XX^1} \]
İsbatı:İsbat (8)-ə görə, \[\frac{\sigma_{T}^2}{\sigma_{X}^2} = \rho_{XX^1}\] İsbat (6)-ya görə,\[\sigma_{X}^2 = \sigma_{X^1}^2\] və korrelyasiyanın tərifinə görə \[\rho_{XX^1} = \frac{\sigma_{XX^1}}{\sigma_{X}\sigma_{X^1}}\]
İsbatı:Nəticə (3)-ə görə,\[\sigma_{E}^2 = \sigma_{X}^2 -\sigma_{T}^2\] Nəticə (8)-ə görə, \[\sigma_{X}^2 -\sigma_{T}^2 = \\ \sigma_{X}^2(1 - \rho_{XX^1})\]
\[\rho_{T_{X}T_{Z}} =\frac{\rho_{XZ}}{\sqrt{\rho_{XX^1}\rho_{ZZ^1}}}\]
İsbatı: \[\rho_{T_{X}T_{Z}} = \frac{\sigma_{T_{X}E_{Z}}}{\sigma_{T_{X}}\sigma_{T_{Z}}} =\frac{\sigma_{T_{X}T_{Z}} +\sigma_{T_{X}E_{Z}} +\sigma_{E_{X}T_{Z}} +\sigma_{E_{X}E_{Z}}} {\sigma_{T_{X}} \sigma_{T_{Z}}} = \frac{\sigma_{T_{X}T_{Z}}}{\sigma_{T_{X}} \sigma_{T_{Z}}}\]
\[\rho_{T_{X}T_{Z}} = \frac{\sigma_{T_{X}T_{Z}}}{\sigma_{T_{X}} \sigma_{T_{Z}}} = \frac{\rho_{XZ}\sigma_{X}\sigma_{Z}}{\sigma_{T_{X}} \sigma_{T_{Z}}} = \frac{\rho_{XZ}}{\frac{\sigma_{T_{X}}}{\sigma_{X}}\frac{\sigma_{T_{Z}}}{\sigma_{Z}}} = \frac{\rho_{XZ}}{\sqrt{\rho_{XX^1}\rho_{ZZ^1}}}\]
Burada \(Y\) paralel testlərdən biridir.
İsbatı: \[E[Y_{i}] = T_{i}\] \[\sigma_{E_{Y_{i}}}^2 = \sigma_{E_{Y}}^2\]
\[T_{X}= E[X]\] \[E[\sum_{i=1}^NY_{i}] = \\ \sum_{i=1}^NE[Y_{i}] = NT_{Y}\] \[T_{X}- E[T_{X}] = NT_{Y}-E[NT_{Y}]\] \[\sigma_{T_{X}}^2 = E[(T_{X} - E[T_{X}])^2] = \\ E[N(T_{Y} - E[T_{Y}])^2] = \\ N^2E[(T_{Y} - E[T_{Y}])^2] = N^2\sigma_{T_{Y}}^2\]
İsbatı:\[E_{X} = X - T_{X} = \\ \sum_{i=1}^NY_{i} - NT_{Y} =\\ NT_{Y} + \sum_{i=1}^NE_{Y_{i}} - NT_{Y} = \\ \sum_{i=1}^NE_{Y_{i}}\] \[\sigma_{E_{X}}^2 = \\ \sum_{i=1}^N\sigma_{E_{Y}}^2 + \sum_{i,j=1,ij}^N\sigma_{E_{Y_{i}}}\sigma_{E_{Y_{j}}} = \\ N\sigma_{E_{Y}}^2\]
İsbatı: \[\rho_{XX^1} = \frac{\sigma_{T_{X}}^2}{\sigma_{X}^2} = \\ \frac{N^2\sigma_{T_{Y}}^2}{\sum_{i=1}^N\sigma_{Y_{i}}^2 + \sum_{i,j=1,ij}^N\sigma_{E_{Y_{i}}}\sigma_{E_{Y_{j}}}} = \\ \frac{N^2\sigma_{T_{Y}}^2}{N\sigma_{Y}^2 + N(N - 1)\rho_{YY^1\sigma_{Y}^2}} = \\ \frac{N\rho_{YY^1}}{1 + (N -1)\rho_{YY^1}}\]
İstifadə olunan ədəbiyyat:
“Introduction to Measurement Theory by Mary J. Allen Wendy M. Yen”
“Theory of Mental Tests. Harold Gulliksen.New York: Wiley,1950. ”
Bu bölməni mənimsədikdən sonra aşağıdakıları biləcək və etməyi bacaracaqsınız:
Testin etibarlılıq əmsalının nə olduğunu;
Etibarlılıq əmsalına təsir edən amilləri;
Etıbarlılıq əmsalının müxtəlif üsullarla hesablama qaydalarını.
Testin etibarlılığının tərifi və onun şərhi müxtəlif üsullarla verilə bilir. Məsələn, testin müşahidə olunan balı ilə onun həqiqi balı öz aralarında yüksək dərəcədə korrelyasiya etdikdə test etibarlı hesab edilir. Odur ki, testləşmədə iştirak edənlərin hamısının müşahidə olunan balı ilə həqiqi balının korrelyasiysının kvadratına (\(\rho_{XT}^2\)) testin etibarlılıq əmsalı deyilir. Əgər, iki paralel test (\({X}\) və \({X^1}\)) geniş seçimdə iştirakçılara verilibdirsə, onda bu iki testin müşahidə olunan balları arasında korrelyasiya (\(\sigma_{XX^1}^2\)) testin etibarlılıq əmsalı olacaqdır.
Lakin, əksər hallarda testin həqiqi balını əldə etmək, həmçinin iki testin paralel olduğunu yoxlamaq mümkün olmur. Beləliklə, testin etibarlılığını digər, əlavə metodlarla ölçmək lazım gəlir.
Etibarlılığın ölçülməsinin ümumi metodlarına keçməmişdən öncə etibarlılıq əmsalının təyin və şərh edilməsinin 6 üsulunu veririk. Burada, etibarlılıq əmsalının hamısı üçün eyni işarələmədən (\(\rho_{XX^1}\)) istifadə olunur.
testin çətinliyi;
tapşırıqların ayırtdetmə əmsalı;
testin uzunluğu (testə daxil edilən tapşırıqların sayı);
imtahan verənlərin ballarının dəyişmə diapozonu;
imtahanın müddəti;
imtahana aid təlimatın səlistliyi;
imtahanın özünün zəhmi.
Yuxarıda qeyd edilmişdir ki, test üzrə iştirakçıların müşahidə olunan balı ilə iştirakçıların həqiqi balları arasındakı korrelyasiyaya testin etibarlılıq göstəricisi deyilir. Bu tərif özlüyündə məntiqi anlaşılan olsa da praktikada özünün əhəmiyyətli tətbiqini tapa bilmir. Çünki, testləşmənin nəticəsində iştirakçının həqiqi balı bir başa müşahidə olunmur. Lakin, bir qrup iştirakçı ilə dalba-dal iki dəfə eyni bir testlə, yaxud paralel formalı testlərlə testləşmə aparıldıqda, müşahidə olunan ballar arasındakı korrelyasıya ilə müşahıdə olunan ballarla həqiqi ballar arasındakı korrelyasiya ilə riyazi əlaqə yaratmaq olur.
Qeyd etmək lazımdır ki, etibarlılıq anlayışı nəzəri anlayışdır və heç bir testə dəqiq paralel test qurmaq mümkün deyil. Bununla belə, etibarlılıq əmsalının hesablanmasının müxtəlif metodları vardır. Bu metodları 3 qrupa bölmək olur:
Bir testin iki dəfə təklif edilməsini tələb edən metodlar;
Paralel yaxud alternativ formalar tətbiq edən metodlar;
Bir testin bir dəfə təklif edilməsini tələb edən metodlar;
Tapşırıqların covariasiyaların hesablanmasına əsaslanan metodlar.
Birinci qrupa qarşılıqlı əvəzolunabilən yaxud, əvəzolunabilən formalardan istifadə metodları və ya eyni bir testdən təkrar (test-retest) istifadə metodları aiddir. Test formaları, eyni bir qrup iştirakçılara qisa bir zaman kəsiyində təklif edilir. Bu iki testləşmədən alınan test balları arasındakı korrelyasiya etibarlılıq əmsalını qiymətləndirir. Bəzən ona etibarlılığın ekvivalentlik əmsalı da deyilir.
Paralel və alternativ formalar-da etibarlılıq əmsalı kimi formaların müşahidə olunan balları arasındakı korrelyasiya hesablanır.
Test-retest metodunda eyni bir test, iştirakçılara iki dəfə təklif edilir. Bu metod vasitəsilə testləşmənin nəticəsinə testləşmə şəraitinin, cavabları təxminetmənin və sairə faktorların təsirini ölçmək olur. Bu zaman bu iki testləşmənin nəticələrinin korrelyasiyasına etibarlılığın dayanıqlıliq əmsalı kimi baxmaq olur. Etibarlılığın hesablanmasında aşağıdakı düsturdan istifadə olunur.
\[\rho_{XX^1} = r_{XX^1}\]
Dayanıqlılıq əmsalının işlədilməsidə əsas problem müxtəlif testləşmələr arasındakı müddətin optimal müəyyən edilməsidir. Bu müddət bir tərəfdən uzun olmalıdır ki, iştirakçı təklif edilən suallari kifayət qədər unuda bilsin, digər tərəfdən də qisa olmalıdır ki, ölçülən sahə üzrə əlavə biliklər əldə etməsin.
Əksər hallarda isə iştirakçılara yalnız bir test forması təklif edilir və testin etibarlılıq əmsalı bu bir testin nəticləri əsasında hesablanır. Bu halda testin etibarlılığının təhlili iştirakçıların hamısının tapşırıqlara cavabların öz aralarında daxili razılaşdırılmasının əsasında aparılır.
Etibarlılıq əmsalının bu yolla qiymətləndirilməsi prosedurlarına daxili razılaşdırma metodları deyilir. Bu metodlar qrupunun ən geniş yayılmışı parçalama metodudur. Testin etibarlılığının hesablanmasında parçalama metodunun tətbiqində test tapşırıqları müəyyən qayda ilə iki hissəyə bölünür və alınan testlərin əmələ gətirdiyi alttestlərin balları arasında korrelyasiya hesablanır. Burada əsas ideya ondan ibarətdir ki, test iki alttestə elə bölünsün ki, alınan alttestlər mümkün qədər paralel testlər xüsusiyyətin öz aralarında əmələ qətirə bilsin.
Testin iki alttestdə parçalanmasını dörd qəbul edilən üsulu vardır:
Tək nömrəli tapşırıqlar birinci alttestə cüt nömrəli tapşırıqlar isə ikinci alttestə salınsın;
Əvvəlcə tapşırıqlar çətinlik dərəcələrinin artması sırasıyla düzülür, sonra tək nömrəli tapşırıqlar birinci alttestə cüt nömrəli tapşırıqlar isə ikinci alttestə salınır;
Tapşırıqlar alttestlərə təsadüfü qaydayla paylanılır;
Tapşırıqlar alttestlərə məzmunlarına uyğun paylanır.
Əgər test bir neçə hissədən ibarət olarsa biz onu iki paralel testə bölməyə çalışarıq. Sonra bu paralel testlər arasında korrelyasiyanı hesablayarıq və Spirmen-Braun düsturundan istifadə edərək bütov testin etibarlılığın taparıq. Bu metodun zəif yeri testin ixtiyari iki hissəyə bölünməsidir.
Biz yuxarıda göstərmişdik ki, \[\sigma_{NT}^2 = N^2\sigma_{T}^2\] və \[\sigma_{NE}^2 = N\sigma_{E}^2\] İndi tutaq ki, \(X(N)\) və \(X^1(N)\), \(X\) və ona paralel olan \(X^1\)-testlərinin \(N\)-dəfə uzadılmasından alınan testlərdir. Onda, \[\rho{X_{(N)}}{X^1_{(N)}} = \\ \frac{N^2\sigma_{T}^2}{N^2\sigma_{T}^2 + N\sigma_{E}^2} = \\ \frac{N\sigma_{T}^2}{N\sigma_{T}^2 + \sigma_{E}^2} = \\ \frac{N\sigma_{T}^2}{N\sigma_{T}^2 + \sigma_{X}^2 - \sigma_{T}^2} = \\ \frac{N\sigma_{T}^2}{ \sigma_{X}^2 + (N-1)\sigma_{T}^2} = \\ \frac{N\rho_{XX^1}}{1 + (N -1)\rho_{XX^1}} \]
Etibarlılığın hesablanmasının aşağıda təklif edilən metodunda bütün alttestlər iştirak edir.
Tutaq ki, \[X = X_{1} + X_{2} + \cdots + X_{N}~~ (4.1)\] N-hissədən ibarətdir və bu hissələr ayrı-ayrı tapşırıqlar da ola bilər. \[T = T_{1} + T_{2} + \cdots + T_{N}~~ (4.2)\] onların həqiqi ballarıdır.
\[\rho_{XX^1} = \frac{\sigma_{T}^2}{\sigma_{X}^2} = \frac{\sum_{i=1}^N\sigma_{T_{i}^2}+\sum_{i=1}^N\sum_{j\neq{i}}^N\sigma_{T_{i}}\sigma_{T_{j}}}{\sigma_{X}^2}~~ (4.3)\] Nəzərə alaq ki, testin hissələrinin doğru ballar üzrə kovariasiyası, onların müşahidə olunan ballar üzrə kovariasiyasına bərabərdir. \[\sum_{i=1}^N\sum_{j-i}^N\sigma_{T_{i}}\sigma_{T_{j}} = \sum_{i=1}^N\sum_{j\neq{i}}^N\sigma_{X_{i}}\sigma_{X_{j}}~~ (4.4)\] İstifadə olunan ədəbiyyat:
“Introduction to Measurement Theory by Mary J. Allen Wendy M. Yen (z-lib.org).pdf”
“Theory of Mental Tests - 1st Edition - Harold Gulliksen”
Bu bölməni mənimsədikdən sonra aşağıdakıları biləcək və etməyi bacaracaqsınız:
Diskret təsadüfü dəyışənlər intervallar, yaxud mütləq şkalada olanda Pirson korrelyasiya əmsalı;
Dəyişənlərdən biri dixotomik (nizam şkalası) digəri daha zəngin şkalada olanda Pirson korrelyasiya əmsalının sadələşməsi;
Dəyişənlərdən hər ikisi dixotomik olanda (nizam şkalası) Pirson korrelyasiya əmsalının sadələşməsi;
İntervallar, yaxud mütləq şkalada ölçülən və üzunluqları eyni olan iki təsadüfü diskret dəyişən arasındakı əlaqənin istiqaməti və gücü Pirson korrelyasiya əmsalı ilə ölçülür. \[r_{XY} = \frac{Cov(XY)}{\sqrt{Var(X)Var(Y)}} = \\ \frac{\sum X_{i}Y_{i} - E[X]E[Y]}{\sqrt{[\sum X^2 - E[X]^2][\sum Y^2 - E[Y]^2]}}\]
Hər iki dəyişən dixotomik adlı şkalada olduqda, onlar arsında əlaqə ölçüsü kimi, \(\varphi\), “fi”-əmsalından istifadə olunur. Məsələn, tutaq ki, {X} və {Y} eyni bir testin dixotomik tapşırıqlarına cavablardır. Onda bu tapşırıqlara cavabların bir-birlərinə nə qədər yaxın olması bu düsturla hesablanır. \[\varphi_{XY} = \frac{p_{XY} - p_{X}p_{Y}}{\sqrt{p_{X}q_{X}p_{Y}q_{Y}}}\]
Burada, \(p_{XY}\), \(X\) və \(Y\) təsadüfü kəmiyyətlərinin hasillərindən alınan diskret təsadüfü kəmiyyətin riyazi gözləməsidir. Aydindır ki \({XY}\)-təsadüfü kəmiyyəti bir qiymətini, yalnız hər iki vuruq bir olduqda alır. Beləliklə, \(p_{XY}\)-sadəcə olaraq hər iki tapşırığa doğru cavab verənlərin payı olur.
\(p_{XY}\), \(X\) və \(Y\)-tapşırığına eyni zamanda doğru cavab verənlərin payı;
\(p_{X}\), \(X\)-tapşırığına doğru cavab verənlərin payı;
\(q_{X} = 1 - p_{X}\), \(X\)-tapşırığına doğru olmayan cavab verənlərin payı;
\(p_{Y}\), \(Y\)-tapşırığına doğru cavab verənlərin payı;
\(q_{Y} = 1 - p_{Y}\), \(Y\)-tapşırığına doğru olmayan cavab verənlərin payı;
Bu düsturun ümumi korrelyasiya düsturundan çıxarılışın verək
\[r_{XY} = \frac{Cov(XY)}{\sqrt{Var(X)Var(Y)}} = \\ \frac{(1/n)\sum X_{i}Y_{i} - E[X]E[Y]}{\sqrt{[(1/n)\sum X^2 - E[X]^2][(1/n)\sum Y^2 - E[Y]^2]}}\] Nəzərə alsaq ki,
\(E[X] = p_{X}\), \(E[Y] = p_{Y}\), \((1/n)\sum X_{i}Y_{i} = p_{XY}\) və
\[\sqrt{[(1/n)\sum X^2 - E[X]^2]} = \\\sqrt{p_{X} - p_{X}^2} = \\ \sqrt{p_{X}(1 - p_{X})} = \\\sqrt{p_{X}q_{X}}\]
Bu çevrilməni Y-dəyişəni üçün də yazsaq. \[\sqrt{[(1/n)\sum Y^2 - E[Y]^2]} = \\\sqrt{p_{Y} - p_{Y}^2} = \\ \sqrt{p_{Y}(1 - p_{Y})} = \\\sqrt{p_{Y}q_{Y}}\]
Bunları nəzərə alsaq yuxarıda verilən \(\varphi\)-əmsalını alarıq.
Dəyişənlərin biri dixotomik (adlı) şkalada, digəri daha zənğin şkalada, məsələn interval, yaxud nizam şkalasında veriləndə onlar arasında korrelyasiya əmsalı biserial korrelyasiya əmsalı adlanır. Məsələn, testin tapşırıqları dixotomikdirsə, onda tapşırığa cavabla testin cəm balları arasındakı korrelyasiya bu şəkildə olur. Diğər bir misal olaraq, biz şagirdlərin buraxılış imtahan balları ilə onların ali məktəblərə qəbul olmaları arasındakı əlaqəyə baxa bilərik. Bu zaman buraxılış imtahan balları intervallar, yaxud nizam şkalasında, qəbul isə dixotomik şkalada olur (1-qəbul olub, 0-qəbul olmayıbdır). Yəni, şagird ali məktəbə qəbul olursa 1 qəbul olmursa 0-la dəyərləndirilir.
Bu iki dəyişənlər arasındakı əlaqəni Pirson korrelyasiya əmsalı ilə hesablamaq olur. Bu halda korrelyasiya əmsalına nöqtəvi-biserial korrelyasiya əmsalı deyilir \(r_{pb}\)-kimi işarə edilir. Burada “biserial”- termini dixotomik dəyişənin iki qiymət almasına işarədir. Bu əmasalın tapılması düsturu və adı Karl Pirsona məxsusdur. Düsturun sadələşdirilmiş forması aşağıdakı kimidir. \[r_{pbl} = \frac{\overline{X_{l1}} - \overline{X_{l0}}}{\sigma_{X}}\sqrt{\frac{n_{1}n_{o}}{n(n -1)}} ~~(1)\]
Bu düsturda, \(l\)-nömrəli tapşırıqla testin cəm balları arasında Pirson korrelyasiya əmsalı verilmişdir.
\(\overline{X_{l1}}\)- Tapşırığa cavablar bir olduqda, cəm balların orta qiyməti
\(\overline{X_{l0}}\)- Tapşırığa cavablar sıfır olduqda, cəm balların orta qiyməti
\({n}\)-testin uzunluğu, \({n_{1}}\)-tapşırığa cavablarda birlərin sayı, \({n_{0}}\)-tapşırığa cavablarda sıfırların sayıdır.
Bu düstur, Pirson korrelyasiya əmsalının bir sadələşdirilmiş formasıdır. Onun aşağıdakı kimi daha iki forması vardır. \[r_{pbl} = \frac{\overline{X_{l1}} - \overline{X}}{\sigma_{X}}\sqrt{\frac{n_{1}n}{n_{0}(n -1)}}~~ (2)\] və \[r_{pbl} = \frac{\overline{X} - \overline{X_{l0}}}{\sigma_{X}}\sqrt{\frac{nn_{o}}{n_{1}(n -1)}}~~ (3)\]
Bu misal G.V.Glass və J.C.Stanleyin “Statistical Methods in Education and Psychology” kitabındandır (1970-ci il).
Misalda, 15 nəfər qadın və kişinin boylarının uzunluğu santimetrlə verilmişdir. Bizi bu iki dəyişən, yəni cinslə boyun uzuluğu arasında əlaqə maraqlandırır. Biz datamızı və vesablamalarımızı R-da edəcəyik.
library(tidyverse)
Adlar <- LETTERS[1:15] # Adları latın əlifbasının baş hərfləri ilə işarə edək
Cinsi <- c(1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0) # kişılər 1, qadınlar sıfırla işarə edək
Boyu <- c(150, 170, 160, 165, 140, 183, 157, 152, 163, 168, 160,
155, 157, 160, 162) ## Boyların uzunluğu santimetrlə
DATA <- data.frame(Adlar,Cinsi, Boyu)
DATA$Boyu <- as.numeric(DATA$Boyu)
DATA
## Adlar Cinsi Boyu
## 1 A 1 150
## 2 B 0 170
## 3 C 1 160
## 4 D 1 165
## 5 E 0 140
## 6 F 1 183
## 7 G 0 157
## 8 H 0 152
## 9 I 1 163
## 10 J 1 168
## 11 K 1 160
## 12 L 0 155
## 13 M 1 157
## 14 N 0 160
## 15 O 0 162
n = 15 # kişı və qadınların birgə sayı
n_1 = 8 # kişılərin sayı
n_2 = 7 # qadınların sayı
M <- mean(DATA$Boyu) # kişı və qadınların boylarının orta qiyməti
Q <- DATA %>%
filter(Cinsi == 1)
M_1 <- mean(Q$Boyu) # Kişilərin boylarının orta qiyməti
M_1
## [1] 163.25
K <- DATA %>%
filter(Cinsi == 0)
M_0 <- mean(K$Boyu) # Qadınların boylarının orta qiyməti
M_0
## [1] 156.5714
S_x <- sd(DATA$Boyu)
S_x # kişı və qadınların boylarının paylanmasının orta kvadratik meyli
## [1] 9.77509
(1)-düsturuna əsasən, nöqtəvi-biserial korrelyasiyanı hesablayaq.
r_1 = ((M_1 - M_0)/S_x)*(7*8/(15*14))^0.5
r_1
## [1] 0.3528151
(2)-düsturuna əsasən, nöqtəvi-biserial korrelyasiyanı hesablayaq.
r_2 = ((M_1 - M)/S_x)*(15*8/(7*14))^0.5
r_2
## [1] 0.3528151
(3)-düsturuna əsasən, nöqtəvi-biserial korrelyasiyanı hesablayaq.
r_3 = ((M - M_0)/S_x)*(7*15/(8*14))^0.5
r_3
## [1] 0.3528151
Hesablamalar göstərir ki, oğlanlar orta hesabla qızlardan hündürdür. Oğlanların orta boyu 163.25 sm, Qızların orta boyu 156.5714 santimetrdir. Lakin, boyla cins arasındakı əlaqə zəifdir (0.3528151)
Bu bölməni mənimsədikdən sonra aşağıdakıları biləcək və etməyi bacaracaqsınız:
Test ballarını şərh etməyi və onları mənalandırmağı;
Testin yazılma məqsədindən asılı olaraq, balların şərhində hansı yanaşmanı (normaya, yaxud meyara istiqamətlənmiş) seçməyi;
Normaya istinad edilən yanaşmada balların növlərini müəyyən etməyi;
İstifadə olunacaq paketlər
library(tidyverse)
library(epmr)
library(psych)
library(psychometric)
library(ShinyItemAnalysis)
library(readr)
library("ggpubr")
Təhsil sahəsində tətbiq edilən ölçü alətlərinin, yəni testlərin nəticələrini konteksdən, yaxud istinad olunduğu sistemdən təcrid olunmuş formada şərh etmək, alınan balları mənalandırmaq demək olar ki, mümkün olmur. Nə demək istədiyimizi aşağıdakıl misalla izah etməyə çalışaq:
Tutaq ki, bir şağird bizə deyir ki, mən sinfimizdə riyaziyyatdan keçirilən testlə imtahandan 20 bal toplamışam. Onda bu deyiləni düzgün başa düşmək üçün, yaxud düzgün mənalandımaq üçün, aşağıdakı kimi iki sual verməyə zərurət yaranır:
1.Sizin sinifdən həmin testi verən diğər şağirdlərin nəticələri necədir?
2.Həmin testdə cəmi neçə sual vardır?
Ümumiyyətlə, sosial ölçmələrdə bu iki növ sual, yəni imtahan aparılan qrupda digərlərinin balları haqda məlumat və testdəki sualların sayının bilinməsi, balların şərhinin normaya, yaxud meyara istinad edilərək aparılmasını müəyyən edir.
Birinci halda, yəni balların şərhi normaya istinad edilərək aparıldıqda ballar norma rolunu oynayan qrupdakı iştirakçıları bir-birləri ilə müqayisə etməyə və onları bu ballara görə ranqlaşdırmağa, yəni artan yaxud azalan sıra ilə düzməyə imkan yaradır. Bizim misalda şagirdlə eyni zamanda test verən həmin sinfin digər şagirdlərinin nəticələri də məlum olarsa, biz bütün sinfin şagirdlərini bu testn nəticələrinə görə artan, yaxud azalan sıra ilə düzə bilərik. Bu zaman şagirdin sinfindəki şagirdlər istinad olunan qrup, yaxud norma qrupu (normanın müəyyən edildiyi qrup) rolunu oynayır.
Məsələn, baxdığımız şagirdin nəticəsi bu sinifdə 90% ola bilər. Bu o deməkdir ki, bu şagird sinifdəkilərin 90%-dən yaxşı nəticə göstəribdir. Başqa sözlə, sinfin şagirdlərinin 90%-nin həmin testdən yığdıqları ballar bu şagirdin nəticəsindən, yəni 20 baldan azdır və ya 20 bala bərabərdir. Beləliklə, bizim şagirdin yığmiş olduğu 20 bal bu konteksdə, belə yanaşmada, yəni həmin imtahanda iştirak edən diğər şagirdlərin fonunda məna kəsb etmiş olur. Şagirdin ölçülən sahə üzrə sırada yerini diğər şagirdlər arasında yığdığı bu 20 bala görə tapa bilirik.
Diğər tərəfdən, baxmayaraq ki, bizim şagirdin bu 20 balla sinifdə nəticəsi 90%-dır, onun testin neçə faizinə cavab verdiyini biz hələ də məlum deyil. Yəni, testdə 20-dən çox sayda sual ola bilərdi və bu fakt bizim şagirdin sinifdəki nisbi yerinə heç bir təsir göstərməzdi.
Biz ikinci sualı şagirdin yoxlanılan materialın, yaxud testin məzmununun əks etdirdiyi materialın, hansı hissəsini mənimsədiyini aşkarlamaq üçün veririk. İkinci suala cavabla onun ölçülən sahə üzrə mütləq yerini müəyyən etmək istəyirik.
İndi, tutaq ki, testdə 40 sual vardır və bizim şagird yuxarıda qeyd edildiyi kimi, 20 suala doğru cavab veribdir. Yəni, 20 balla testin tapşırıqlarının cəmi yarısına, yəni 50%-nə doğru cavab vermişdir. Onda, şagirdin yığdığı 20 balın bu yolla şərhinə meyara istinad edilməklə şərh, yaxud məzmuna istiqamətlənmiş şərh deyilir. Göründüyü kimi, bu zaman 20 bal tamamilə başqa, məna kəsb edir. O şagirdin verdiyi doğru cavabların faizini ifadə edir və biz bunu ölçülən meyarın (sahənin) şagir tərəfindən mənimsənilən hissəsi kimi qəbul edirik.
Test ballarının meyara istiqamətlənmiş şərhi, buraxılış imtahanlarında, yaxud hansısa bir kursun sonunda kurs materiallarının bəlli səviyyədə mənimsənilməsinin yoxlanılmasında və sairə bu kimi yekun nəticələrin ölçülməsində geniş istifadə olunur. Məsələn, tutaq ki, müvafiq qrum tərəfindən qərar qəbul olunur ki, sürüçülük kursunu bitirən, yaxud tibb texnikomunu bitirən müdavim kursun nəzəri materialının 90%-ni bilməlidir. Bu o deməkdir ki, əvvəlcədən bir keçid balı müəyyən edilir (90%) və yalnız, imtahanın nəticəsində bu keçid balından çox yığmiş olanlar kursu mənimsəmiş hesab edilirlər. Təhsil sahəsində də əksər test ballarının (məsələn BSQ-lərin) şərhi də bu konteksdə aparılmalıdır. Yəni, şagird keçilmiş materialın hansı hissəsini mənimsəməlidir və hansı hissəsini mənimsəmişdir sualına cavab axtarılmalıdır.
Çoxlu sayda geniş yayılmış nailiyyət testləri vardır ki, onların ballarının şərhində hər iki yanaşmadan, yəni həm normaya istinad edilən, həm də meyara istinad edilən şərhlərdən istifadə olunur. Bu zaman hər iki göstərici, yəni iştirakçının norma qrupundakı yeri və ölçülən konstruktun ayri-ayri kompanentləri üzrə doğru cavabların faizi göstərilir.
Bununla yanaşı, sosial sahələrdəki ölçmələrdə əsasən ya normaya ya da meyara istinad edilmiş yanaşmalardan birindən istifadə olunur. Meyara istinad edilmiş yanaşmalarda adətən, ölçülən konstrukt keçid nöqtələrilə müəyyən kateqoriyalara bölünür və iştirakçı yığdığı balın miqdarından asılı olaraq bu və ya digər kateqoriyaya aid edilir.
Məsələn, 40 tapşırıqdan ibarət yekun testin nəticələrini (0, 10], (10, 20], (20, 30], (30, 40] kimi 4 yerə bölüb, şagirdin yığdığı balın hansı hissəyə düşməsindən asılı olaraq nəticəni “qeyri-kafi”, “kafi”, “yaxşı”, “əla” kimi dəyərləndirmək olar və sairə.
Normaya istinad olunan testlərdə məqsəd ölçülən sahə üzrə iştirakçıları bir-birlərilə müqayisə edə bilməkdir. Məsələn, yeni anadan olmuş uşağın çəkisi və boyunun uzunluğu normaya görə müəyyən edilir. Adətən, bu zaman norma qrupu olaraq uşağın anadan olduğu ölkənin bütün yeni doğulmuş uşaqlar çoxluğu təşkil edir. Məsələn, konkret yeni doğulmuş uşağın boyu 70%, çəkisi 85%-dir o deməkdir ki, onun boyu ölkədə yeni anadan olan uşaqların 70%-nin boyundan böyük ya bərabər, çəkisi ölkədə yeni anadan olan uşaqların 85%-nin çəkisindən böyük ya bərabərdir.
Çoxlu sayda qabiliyyət, nailiyyət və fərdi testlərin də balları normaya istinad olunaraq şərh edilir. Bunlardan ən geniş yayılanı və hamıya yaxşı tanış olanları, İQ-testləri, yaxud intellekt testləridir. Bu testlərdən yığılan ballar digərlərinin bu testlərdən yığdıqları balların əsasında (fonunda) mənalandırılır. Burada balların paylanması orta qiyməti 100, orta kvadratik meyli 15 olan bir şkalada verilir. Deməli, İQ-testindən 115 bal toplamaq paylanmanın orta qiymətindən bir orta kvadratik meyl qədər yuxarıda olmaq deməkdir.
Normaya istinad olunan testlər çox vaxt seçim məqsədləri üçün tərtib edilir. Məsələn, SAT, GRE kimi testlər bu növ testlərdəndir. Lakin, normaya istinad edilən testlərin heç də hamısında seçim məqsədi güdülmür. Məsələn, yuxarıda qeyd olunan anadan yeni doğulmuş uşaqların çəkisinin, yaxud boyunun normaya görə tapılmasında seçim məqsədi yoxdur.
Beləliklə, balların şərhi üçün istinad olunan sistemin seçilməsi testin məqsədindən asılı olur.
Əgər testləşmənin nəticəsində alınan ballar iştirakçıları bir-birlərilə müqayisə üçün istifadə olunacaqsa onda normaya istinad olunan testlərdən istifadə məqsədə uyğundur. Əgər ölçmənin məqsədi iştirakçının ölçülən sahəni nə dərəcədə mənimsədiyini müəyyən etməkdirsə, onda meyara istinad edilən test məqsədə uyğundur.
Bu iki növ testin tərtibində tapşırıqlarının seçilməsi də fərqlidir. Əgər, test meyara istiqamətlənmiş testdirsə, onda tapşırıqların çətinlik dəcələri keçid nöqtəsinin ətrafında olmalıdır. Əgər, test normaya istiqamətlənmiş testdirsə, onda tapşırıqların çətinlik dəcələri geniş diapozonda olmalıdır.
Sosial ölçmələrdə daha çox normaya isinad edən testlərdən istifadə edildiyindən biz bu növ testlərə daha geniş baxacayıq.
Yuxarıda qeyd olunduğu kimi normaya yönəldilmiş testlərdə ballar norma qrupundakı digər iştirakçıların ballarına istinad olunaraq şərh edilir. Belə qrupa norma qrupu, bu qrupdan alınan ballara isə çox vaxt normalar deyilir. Bir çox hallarda istifadə olunan testlər üçün norma qrupu tərkibinə və sayına görə kifayət qədər geniş olur. Lakin, balların təhrif olunmamış şərhi üçün norma qrupları kifayət qədər geniş olmamalı, tərkibinə və sayına görə testin məqsədinə uyğun olmalıdır.
Normaya istinad edilən yanaşmanın populyar olması nəticəsində çoxlu sayda normaya istinad olunaraq şərh edilən ballar tipi yaranmışdır. Bunlara misal olaraq, persentil rankları, Z və T balları, normallaşdırılmış Z və T balları, staninləri və sairə ekvivalent balları göstərmək olar.
Bu sadalananlar və bunlardan başqa normaya istinad olunaraq şərh edilən ballar çiy və ya ilkin balların çevrilməsindən alınır və balların şərhinin başa düşülməsinin sadələşdirilməsinə xidmət edir. Burada çiy və ya ilkin bal dedikdə tapşırıqlara verilən doğru cavabların cəmi başa düşülür. Onların çevrilməsindən (xətti və ya geyri-xətti) alınan digər bal tiplərinin ümumi adı isə törəmə ballardır.
Yuxarıda qeyd olunduğu kimi, bu balları təcrid edilmiş formada şərh etmək mümkün deyil.
Z-qiymətlər-konkret çiy balın paylanmanın orta qiymətinə nəzarən harada yerləşməsi haqda məlumat verir. Yəni, bu balın orta qiymətin solunda yaxud sağında yerləşməsindən və orta qiymətdən neçə standart vahid uzaqda olmasından xəbər verir
T-qiymətlər Z-qiymətlərin xətti çevrilməsindən alınır. Sadəçə olaraq, Z-qiymətlər 10-a vurulub üzərinə 50 gəlirlər.
Persentil ranklar(percentile ranks). Persentil ranklar verilən baldan az yığan iştirakçıların faizini göstərir. Məsələn, norma qrupunda 65 baldan az yığanlar 50% təşkil edirlərsə, bu o deməkdir ki, 65 balın 50-ci persentil ranqı var. Biz bunu P50 kimi işarə edəcəyik. Persentil ranklar asan başa düşüldüyündən və norma qruplarının hamısına tətbiq oluna bildiyindən geniş yayılıb və müəyyən üstünlüklərə malikdir. Daha çox istifadə olunan P25, P50, P75 persentil ranklar quartillər adlanır. Çünki, onlar bütün baalları 4 bərabər hissəyə bülür. P10, P20, P3, … , P100-ə isə desillər deyilir və balları 10 bərabər yerə bölür.
Çətinlik dərəcələrinə görə müxtəlif testlərin cəm ballarının paylanmalarını bir-birləri ilə müqayisə etmək üçün özümüzün süni surətdə tərtib etdiyimiz üç testi (Asan, Orta və Çətin) R proqramına yükləyirik. Bu testlərin necə tərtib olunduqları vəsaitin axırında “Dataların düzəldilməsi” hissəsində verilmişdir.
Asan <- read_csv("Asan.csv")
Orta <- read_csv("Orta.csv")
Çətin <- read_csv("Çətin.csv")
Hər bir data proqrama yükləndikdən sonra mütləq, onun qruluşuna baxılmalıdır. Burada, onun ölçüləri, yəni sətir və sütunların sayı, sütunlarda yerləşən dəyişənlər, onların tiplıri haqda məlumat verilir. Qeyd edək ki, datanın dəyişənlər üzərində hər hansı bir əməliyyatın aparılması üçün unun dəyişənlərinin qruluşu və tiplərinin bilinməsi çox vacibdir. Qeyd edək ki, datalar ümumiyyətlə desək çox mürəkkəb ola bilir. Bizim halda datalar qruluşlarına görə çox sadədir. Belə ki hər üç testdə yalnız, 1000 iştirakçının 40 asan, orta və çətin suallara cavabları verilmişdir.
glimpse(Asan)
## Rows: 1,000
## Columns: 40
## $ `Tapsh-1` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0,…
## $ `Tapsh-2` <dbl> 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1,…
## $ `Tapsh-3` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1,…
## $ `Tapsh-4` <dbl> 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1,…
## $ `Tapsh-5` <dbl> 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-6` <dbl> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-7` <dbl> 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1,…
## $ `Tapsh-8` <dbl> 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-9` <dbl> 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-10` <dbl> 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0,…
## $ `Tapsh-11` <dbl> 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1,…
## $ `Tapsh-12` <dbl> 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-13` <dbl> 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-14` <dbl> 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1,…
## $ `Tapsh-15` <dbl> 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1,…
## $ `Tapsh-16` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-17` <dbl> 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1,…
## $ `Tapsh-18` <dbl> 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-19` <dbl> 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-20` <dbl> 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1,…
## $ `Tapsh-21` <dbl> 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1,…
## $ `Tapsh-22` <dbl> 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-23` <dbl> 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1,…
## $ `Tapsh-24` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-25` <dbl> 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-26` <dbl> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1,…
## $ `Tapsh-27` <dbl> 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1,…
## $ `Tapsh-28` <dbl> 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0,…
## $ `Tapsh-29` <dbl> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1,…
## $ `Tapsh-30` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-31` <dbl> 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0,…
## $ `Tapsh-32` <dbl> 0, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-33` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1,…
## $ `Tapsh-34` <dbl> 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0,…
## $ `Tapsh-35` <dbl> 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0,…
## $ `Tapsh-36` <dbl> 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1,…
## $ `Tapsh-37` <dbl> 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-38` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-39` <dbl> 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1,…
## $ `Tapsh-40` <dbl> 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1,…
glimpse(Orta)
## Rows: 1,000
## Columns: 40
## $ `Tapsh-1` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0,…
## $ `Tapsh-2` <dbl> 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1,…
## $ `Tapsh-3` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1,…
## $ `Tapsh-4` <dbl> 0, 1, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1,…
## $ `Tapsh-5` <dbl> 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1,…
## $ `Tapsh-6` <dbl> 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-7` <dbl> 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1,…
## $ `Tapsh-8` <dbl> 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0,…
## $ `Tapsh-9` <dbl> 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1,…
## $ `Tapsh-10` <dbl> 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0,…
## $ `Tapsh-11` <dbl> 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1,…
## $ `Tapsh-12` <dbl> 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-13` <dbl> 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0,…
## $ `Tapsh-14` <dbl> 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1,…
## $ `Tapsh-15` <dbl> 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 0, 1,…
## $ `Tapsh-16` <dbl> 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-17` <dbl> 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0,…
## $ `Tapsh-18` <dbl> 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-19` <dbl> 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0,…
## $ `Tapsh-20` <dbl> 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1,…
## $ `Tapsh-21` <dbl> 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1,…
## $ `Tapsh-22` <dbl> 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-23` <dbl> 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-24` <dbl> 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1,…
## $ `Tapsh-25` <dbl> 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-26` <dbl> 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-27` <dbl> 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1,…
## $ `Tapsh-28` <dbl> 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1,…
## $ `Tapsh-29` <dbl> 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0,…
## $ `Tapsh-30` <dbl> 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0,…
## $ `Tapsh-31` <dbl> 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0,…
## $ `Tapsh-32` <dbl> 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-33` <dbl> 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1,…
## $ `Tapsh-34` <dbl> 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0,…
## $ `Tapsh-35` <dbl> 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0,…
## $ `Tapsh-36` <dbl> 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1,…
## $ `Tapsh-37` <dbl> 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1,…
## $ `Tapsh-38` <dbl> 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-39` <dbl> 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1,…
## $ `Tapsh-40` <dbl> 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1,…
glimpse(Çətin)
## Rows: 1,000
## Columns: 40
## $ `Tapsh-1` <dbl> 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0,…
## $ `Tapsh-2` <dbl> 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1,…
## $ `Tapsh-3` <dbl> 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1,…
## $ `Tapsh-4` <dbl> 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1,…
## $ `Tapsh-5` <dbl> 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1,…
## $ `Tapsh-6` <dbl> 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0,…
## $ `Tapsh-7` <dbl> 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1,…
## $ `Tapsh-8` <dbl> 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0,…
## $ `Tapsh-9` <dbl> 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0,…
## $ `Tapsh-10` <dbl> 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0,…
## $ `Tapsh-11` <dbl> 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1,…
## $ `Tapsh-12` <dbl> 1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0,…
## $ `Tapsh-13` <dbl> 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0,…
## $ `Tapsh-14` <dbl> 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1,…
## $ `Tapsh-15` <dbl> 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 1, 0, 1,…
## $ `Tapsh-16` <dbl> 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1,…
## $ `Tapsh-17` <dbl> 0, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0,…
## $ `Tapsh-18` <dbl> 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1,…
## $ `Tapsh-19` <dbl> 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,…
## $ `Tapsh-20` <dbl> 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1,…
## $ `Tapsh-21` <dbl> 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1,…
## $ `Tapsh-22` <dbl> 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1,…
## $ `Tapsh-23` <dbl> 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1,…
## $ `Tapsh-24` <dbl> 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1,…
## $ `Tapsh-25` <dbl> 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1,…
## $ `Tapsh-26` <dbl> 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1,…
## $ `Tapsh-27` <dbl> 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0,…
## $ `Tapsh-28` <dbl> 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0,…
## $ `Tapsh-29` <dbl> 0, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0,…
## $ `Tapsh-30` <dbl> 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0,…
## $ `Tapsh-31` <dbl> 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0,…
## $ `Tapsh-32` <dbl> 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0,…
## $ `Tapsh-33` <dbl> 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1,…
## $ `Tapsh-34` <dbl> 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0,…
## $ `Tapsh-35` <dbl> 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0,…
## $ `Tapsh-36` <dbl> 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1,…
## $ `Tapsh-37` <dbl> 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 1,…
## $ `Tapsh-38` <dbl> 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0,…
## $ `Tapsh-39` <dbl> 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1,…
## $ `Tapsh-40` <dbl> 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1,…
Testin cəm ballarının düzəldilməsi “rowSums” funksiyasının köməyilə edilir. Cəm balların tezliklərinə görə paylanmasının tapılmasımnda “table” funksiyasından istifadə etmişik.
Cəm_bal_Asan <- rowSums(Asan) ## Asan testin cəm ballarının tapılıması
Cəm_bal_Orta <- rowSums(Orta) ## Orta testin cəm ballarının tapılıması
Cəm_bal_Çətin <- rowSums(Çətin) ## Çətin testin cəm ballarının tapılıması
table(Cəm_bal_Asan) ## Asan testin cəm ballarının tezliklərinə görə paylanması
## Cəm_bal_Asan
## 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
## 1 2 2 11 5 7 7 14 15 22 19 23 35 33 29 47 47 55 52 46 45 60 51 51 57 67
## 35 36 37 38 39 40
## 48 45 42 33 19 10
table(Cəm_bal_Orta) ## Orta testin cəm ballarının tezliklərinə görə paylanması
## Cəm_bal_Orta
## 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
## 1 1 2 3 9 24 17 21 29 28 41 51 54 37 48 56 44 43 53 38 42 51 33 39 42 29
## 30 31 32 33 34 35 36 37 38 39 40
## 33 25 25 21 15 19 10 9 4 1 2
table(Cəm_bal_Çətin) ## Çətin testin cəm ballarının tezliklərinə görə paylanması
## Cəm_bal_Çətin
## 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
## 1 3 7 21 21 42 53 65 58 76 70 73 62 51 44 44 40 38 41 29 21 26 26 18 17 15
## 28 29 30 31 32 33 35 37 38
## 13 6 4 3 4 4 2 1 1
Müxtəlif səviyyəli testlərin cəm balların müqayisə olunması məqsədiylə hər üç növ testin cəm ballarının xarakteristikalarının bir yerdə cədvəl formasında verilməsi
DF <- rbind(ASAN = summary(Cəm_bal_Asan), ORTA = summary(Cəm_bal_Orta), Çətin = summary(Cəm_bal_Çətin))
DF
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## ASAN 9 24 29 28.426 34 40
## ORTA 4 16 21 21.634 27 40
## Çətin 2 10 14 14.871 19 38
Bu cədvələ görə asan testdə minimum bal 9 maksimum bal 40, median 29, orta qiymət 28.426-dir.
Orta testdə minimum bal 4 maksimum bal 40, median 21, orta qiymət 21.634-dir.
Çətin testdə minimum bal 2 maksimum bal 38, median 14, orta qiymət 14.871-dir.
Cəm ballarının qruluşuna növbəti baxışı gövdə və budaq (Stem and Leaf Plot) təqdimatı vasıtəsilə edək. İmtahanda iştirak edənlərin sayı qismən az olanda, cəm ballarının bu növ təqdimatda müqayisəsi daha effektiv olur.
stem(Cəm_bal_Asan, scale = 2) ## Asan testin cəm ballarının gövdə və budaq təqdimatı
##
## The decimal point is at the |
##
## 9 | 0
## 10 | 00
## 11 | 00
## 12 | 00000000000
## 13 | 00000
## 14 | 0000000
## 15 | 0000000
## 16 | 00000000000000
## 17 | 000000000000000
## 18 | 0000000000000000000000
## 19 | 0000000000000000000
## 20 | 00000000000000000000000
## 21 | 00000000000000000000000000000000000
## 22 | 000000000000000000000000000000000
## 23 | 00000000000000000000000000000
## 24 | 00000000000000000000000000000000000000000000000
## 25 | 00000000000000000000000000000000000000000000000
## 26 | 0000000000000000000000000000000000000000000000000000000
## 27 | 0000000000000000000000000000000000000000000000000000
## 28 | 0000000000000000000000000000000000000000000000
## 29 | 000000000000000000000000000000000000000000000
## 30 | 000000000000000000000000000000000000000000000000000000000000
## 31 | 000000000000000000000000000000000000000000000000000
## 32 | 000000000000000000000000000000000000000000000000000
## 33 | 000000000000000000000000000000000000000000000000000000000
## 34 | 0000000000000000000000000000000000000000000000000000000000000000000
## 35 | 000000000000000000000000000000000000000000000000
## 36 | 000000000000000000000000000000000000000000000
## 37 | 000000000000000000000000000000000000000000
## 38 | 000000000000000000000000000000000
## 39 | 0000000000000000000
## 40 | 0000000000
Cədvəli necə başa düşmək lazımdır? Asan testdə an aşağı bal 9-dur və bu balı cəmi bir nəfər yığıb. Gövdə 9-dur, budaqda cəmi bir sıfır var. Növbəti bal 10-dur və bu balı iki nəfər yığıb. Gövdə 10-dur, budaq hissəsində iki sıfır vardır və sairə.
stem(Cəm_bal_Orta, scale = 2) ## Orta testin cəm ballarının gövdə və budaq təqdimatı
##
## The decimal point is at the |
##
## 4 | 0
## 5 | 0
## 6 | 00
## 7 | 000
## 8 | 000000000
## 9 | 000000000000000000000000
## 10 | 00000000000000000
## 11 | 000000000000000000000
## 12 | 00000000000000000000000000000
## 13 | 0000000000000000000000000000
## 14 | 00000000000000000000000000000000000000000
## 15 | 000000000000000000000000000000000000000000000000000
## 16 | 000000000000000000000000000000000000000000000000000000
## 17 | 0000000000000000000000000000000000000
## 18 | 000000000000000000000000000000000000000000000000
## 19 | 00000000000000000000000000000000000000000000000000000000
## 20 | 00000000000000000000000000000000000000000000
## 21 | 0000000000000000000000000000000000000000000
## 22 | 00000000000000000000000000000000000000000000000000000
## 23 | 00000000000000000000000000000000000000
## 24 | 000000000000000000000000000000000000000000
## 25 | 000000000000000000000000000000000000000000000000000
## 26 | 000000000000000000000000000000000
## 27 | 000000000000000000000000000000000000000
## 28 | 000000000000000000000000000000000000000000
## 29 | 00000000000000000000000000000
## 30 | 000000000000000000000000000000000
## 31 | 0000000000000000000000000
## 32 | 0000000000000000000000000
## 33 | 000000000000000000000
## 34 | 000000000000000
## 35 | 0000000000000000000
## 36 | 0000000000
## 37 | 000000000
## 38 | 0000
## 39 | 0
## 40 | 00
stem(Cəm_bal_Çətin, scale = 2) ## Çətin testin cəm ballarının gövdə və budaq təqdimatı
##
## The decimal point is at the |
##
## 2 | 0
## 3 | 000
## 4 | 0000000
## 5 | 000000000000000000000
## 6 | 000000000000000000000
## 7 | 000000000000000000000000000000000000000000
## 8 | 00000000000000000000000000000000000000000000000000000
## 9 | 00000000000000000000000000000000000000000000000000000000000000000
## 10 | 0000000000000000000000000000000000000000000000000000000000
## 11 | 00000000000000000000000000000000000000000000000000000000000000000000
## 12 | 00000000000000000000000000000000000000000000000000000000000000000000
## 13 | 00000000000000000000000000000000000000000000000000000000000000000000
## 14 | 00000000000000000000000000000000000000000000000000000000000000
## 15 | 000000000000000000000000000000000000000000000000000
## 16 | 00000000000000000000000000000000000000000000
## 17 | 00000000000000000000000000000000000000000000
## 18 | 0000000000000000000000000000000000000000
## 19 | 00000000000000000000000000000000000000
## 20 | 00000000000000000000000000000000000000000
## 21 | 00000000000000000000000000000
## 22 | 000000000000000000000
## 23 | 00000000000000000000000000
## 24 | 00000000000000000000000000
## 25 | 000000000000000000
## 26 | 00000000000000000
## 27 | 000000000000000
## 28 | 0000000000000
## 29 | 000000
## 30 | 0000
## 31 | 000
## 32 | 0000
## 33 | 0000
## 34 |
## 35 | 00
## 36 |
## 37 | 0
## 38 | 0
Bu cədvəldə asan testdə görə tezliklərin necə aşağıya sürüşdüyü aydın görmək olur. Yəni, an aşağı bal 2-ni bir nəfər nəfər yığıbdır. Gövdə 2-dir, budaqda cəmi bir sıfır vardır. İkinci yuxarı bal 3-dür və bu balı üç nəfər yığıbdır. Gövdə 3-dür, budaqda da üç sıfır vardır və sairə.
Çətinlik səviyyələrinə görə fərqlənən bu testlərin cəm ballarının necə paylandığını müşahidə etmək məqsədilə onların histoqramlarını yan-yana verək.
par(mfrow = c(1,3))
hist(Cəm_bal_Asan, prob = TRUE, breaks = 20)
lines(density(Cəm_bal_Asan), col = 2, lwd = 3)
hist(Cəm_bal_Orta, prob = TRUE, breaks = 20)
lines(density(Cəm_bal_Orta), col = 2, lwd = 3)
hist(Cəm_bal_Çətin, prob = TRUE, breaks = 20)
lines(density(Cəm_bal_Çətin), col = 2, lwd = 3)
Müxtəlif səviyyəli testlərin nəticələrini müqayisə etmək üçün daha iki təqdimat növündən istifadə edə bilərikl. Bığlı qutu qrafiki və sıxlıq qrafikləri.
Balı <- Cəm_bal_Asan
Adı <- rep("Asan", length.out = nrow(Asan))
df_asan <- cbind(Adı, Balı)
Balı <- Cəm_bal_Orta
Adı <- rep("Orta", length.out = nrow(Orta))
df_orta <- cbind(Adı, Balı)
Balı <- Cəm_bal_Çətin
Adı <- rep("Çətin", length.out = nrow(Çətin))
df_çətin <- cbind(Adı, Balı)
df <- rbind(df_asan, df_orta, df_çətin)
df <- as.data.frame(df)
df$Balı <- as.numeric(df$Balı)
library(ggplot2)
g <- ggplot(df, aes(Adı, Balı))
g + geom_boxplot(aes(fill = Adı)) +
theme(axis.text.x = element_text(angle=65, vjust=0.6)) +
labs(title="Box plot",
caption="Source: df",
x = "Səviyyələr",
y = "Cəm ballar")
theme_set(theme_classic())
G2 <- ggplot(df, aes(Balı))
G2 + geom_density(aes(fill= factor(Adı), alpha=0.8)) +
labs(title = "Səviyyələr üzrə cəm balların sıxlıq qrafikləri",
x="Ballar")
Cəm balların paylanması ilə daha ətraflı tanış olmaq üçün daha iki test göstəricisindən istifadə edək
##### Combine in a data frame and create a scatterplot
data <- Asan
data_Bal <- rowSums(data)
escores <- rnorm(length(data_Bal), 0, 1.4)
tscores <- setrange(data_Bal - escores, y = data_Bal)
data_scores <- data.frame(x1 = data_Bal, t = tscores,
e = escores)
ggplot(data_scores, aes(x1, t)) +
geom_point(position = position_jitter(w = .3)) +
geom_abline(col = "blue",lwd =2)
Yuxarıda aparılan araşdırmaların hər birindən hansı testin cəm ballarının tezliklərinin paylanmasının normal paylanmaya daha yaxın olduğunu asan görmək olar.
DF
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## ASAN 9 24 29 28.426 34 40
## ORTA 4 16 21 21.634 27 40
## Çətin 2 10 14 14.871 19 38
Bu cədvəldən görünür ki, Asan testdə median, orta qiymətdən böyükdür, yəni paylanma sola doğru əyilibdir. Orta səviyyəli testdə median, orta qiymətə təxminən bərabərdir. Deməli cəm balların tezliklərinin paylanması normal paylanmanın simmetriklik şərtini ödəyir. Çətin səviyyəli testdə isə median, orta qiymətdən kiçikdir. Yəni, paylanma sağa doğru əyilibdir. Başqa sözlə, test nisbətən çətin olduğundan iştirakçıların çoxu aşağı bal toplayıbdır.
Bunlarla yanaşı, cəm balların tezliklərinin paylanmasının normal paylanmya nə qədər yaxın olduğunu statistik testlərlə yoxlamaq lazımdır. Paylanmanın normal paylanmaya yaxın olub-olmamasını yoxlayan çoxlu sayda statistik testlər vardır. Məsələn, Shapiro-Wilk testi, yaxud Kolmoqorov-Smirnov testi və sairələri. Shapiro-Wilk testində iştirakçıların sayına məhdudiyyət vardır.
Statistik tesstlərə keçməmişdən öncə, cəm balların tezliklərinin paylanmasına bir də nəzər salaq.
Asan testin cəm ballarının paylanmasl qrafiki
ggdensity(Cəm_bal_Asan,
main = "Asan testin cəm ballarının paylanması",
xlab = "Ballar")
Bu təqdimatda Asan testin cəm ballarinın kvantilləri normal paylanmanın kvantilləri ilə müqayisə edilir. Müqayisədə, onlar bir düz xətt üzərinə düşürsə, yaxud az fərqlidirsə, onda paylanma normal hesab edilə bilir
ggqqplot(Cəm_bal_Asan)
## Warning: The following aesthetics were dropped during statistical transformation: sample
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## The following aesthetics were dropped during statistical transformation: sample
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
Orta testin cəm ballarının paylanmasl qrafiki
ggdensity(Cəm_bal_Orta,
main = "Orta testin cəm ballarının paylanması",
xlab = "Ballar")
ggqqplot(Cəm_bal_Orta)
## Warning: The following aesthetics were dropped during statistical transformation: sample
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## The following aesthetics were dropped during statistical transformation: sample
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
Çətin testin cəm ballarının paylanmasl qrafiki
ggdensity(Cəm_bal_Çətin,
main = "Çətin testin cəm ballarının paylanması",
xlab = "Ballar")
ggqqplot(Cəm_bal_Çətin)
## Warning: The following aesthetics were dropped during statistical transformation: sample
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
## The following aesthetics were dropped during statistical transformation: sample
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
Statistik testlər
shapiro.test(Cəm_bal_Asan)
##
## Shapiro-Wilk normality test
##
## data: Cəm_bal_Asan
## W = 0.97231, p-value = 7.067e-13
shapiro.test(Cəm_bal_Orta)
##
## Shapiro-Wilk normality test
##
## data: Cəm_bal_Orta
## W = 0.98563, p-value = 2.399e-08
shapiro.test(Cəm_bal_Çətin)
##
## Shapiro-Wilk normality test
##
## data: Cəm_bal_Çətin
## W = 0.96222, p-value = 2.042e-15
Hər üç səviyyədən olan testlərin cəm ballarının normal paylanmaya yaxın olmasının Shapiro-Wilk testi ilə yoxlanılmasında sıfırıncı fərziyədən imtina olunur. Asan test üçün p-value = 7.067e-13, orta səviyyəli test üçün p-value = 2.399e-08 və çətin səviyyəli test üçün p-value = 2.042e-15. Göründüyü kimi orta səviyyəli test üçün p-qiymət, digərlərindın kifayət qədər böyükdür, lakin sıfırıncı fərziyəni qəbul etməyə kifayət etmir.
Aşağıdakı cədvəldə hər üç növ testin cəm ballarının paylanmasının dikliyini və ya yastılığını (“kurtosis”) həmçinin, sağa və ya sola meyliyini (“skewnes”) göstərən statistik göstəricilər də daxil olmaqla, əsas xarakteristikalarından ibarət cədvəl verilmişdir
tab_Asan <- describe(Cəm_bal_Asan)[, c("n", "min", "max", "mean", "median", "sd", "skew", "kurtosis")]
tab_Asan$kurtosis <- tab_Asan$kurtosis + 3
tab_Orta <- describe(Cəm_bal_Orta)[, c("n", "min", "max", "mean", "median", "sd", "skew", "kurtosis")]
tab_Orta$kurtosis <- tab_Orta$kurtosis + 3
tab_Çətin <- describe(Cəm_bal_Çətin)[, c("n", "min", "max", "mean", "median", "sd", "skew", "kurtosis")]
tab_Çətin$kurtosis <- tab_Çətin$kurtosis + 3
Cədvəl <- rbind(tab_Asan, tab_Orta, tab_Çətin)
rownames(Cədvəl) <- c("Asan", "Orta", "Çətin")
Cədvəl
## n min max mean median sd skew kurtosis
## Asan 1000 9 40 28.43 29 6.57 -0.45 2.56
## Orta 1000 4 40 21.63 21 7.26 0.15 2.28
## Çətin 1000 2 38 14.87 14 6.32 0.67 3.01
Bu cədvəlin birinci sətrində Asan testin cəm ballarının paylanma xarakteristikaları verilmişdir. Göründüyü kimi paylanma sola meylli olduğundan meyllilik mənfi (-0.45) qiymət alıbdır. Çətin tapşırığın sağa meylliyi daha çoxdur (asanın mütləq qiymətinə görə).
tosc -Cəm balların hər birindən bir dənə götürülür və onlar artan sıra ilə düzülür
perc -Birinci sütunda olan hər bir bal üçün persentil ranq hesablanır
sura -Birinci sütunda olan hər bir bal üçün uğurluluq əmsalı hesablanır. Yəni, içtirakçının yığdığı bal, testin yığılan maksimum balının hansı faiizini təşkil edir. Misal üçün bizim halda, testin maksimum balı 40-baldır və onu yığan da var. Onda, 32 bal toplayan adamın uğurluluq dərəcəsi \(32/40*100 = 80\) olar.
zsco və tsco -nun necə alındı yuxarıda verilmişdir.
Aşağıdakı cədvəldə bizim asan testtimiz üçün cəm balların bu göstəriciləri hesablanmışdır.
Asan səviyyəli test üçün cədvəlin düzəldilməsi
tosc <- sort(unique(Cəm_bal_Asan)) # Çəm balların səviyyələri
perc <- ecdf(Cəm_bal_Asan)(tosc) # Çəm balların persentillərı
sura <- round(100 * (tosc / max(Cəm_bal_Asan)),2) # Uğurluluq dərəcəsi
zsco <- round(sort(unique(scale(Cəm_bal_Asan))),2) # Z-ballar
tsco <- 50 + 10 * zsco # T-ballar
AS <- cbind(tosc, perc, sura, zsco, tsco)
AS <- as.tibble(AS)
Cədvəl_Asan <- AS %>%
mutate(Adi = "Asan")
knitr::kable(Cədvəl_Asan)
| tosc | perc | sura | zsco | tsco | Adi |
|---|---|---|---|---|---|
| 9 | 0.001 | 22.5 | -2.96 | 20.4 | Asan |
| 10 | 0.003 | 25.0 | -2.81 | 21.9 | Asan |
| 11 | 0.005 | 27.5 | -2.65 | 23.5 | Asan |
| 12 | 0.016 | 30.0 | -2.50 | 25.0 | Asan |
| 13 | 0.021 | 32.5 | -2.35 | 26.5 | Asan |
| 14 | 0.028 | 35.0 | -2.20 | 28.0 | Asan |
| 15 | 0.035 | 37.5 | -2.04 | 29.6 | Asan |
| 16 | 0.049 | 40.0 | -1.89 | 31.1 | Asan |
| 17 | 0.064 | 42.5 | -1.74 | 32.6 | Asan |
| 18 | 0.086 | 45.0 | -1.59 | 34.1 | Asan |
| 19 | 0.105 | 47.5 | -1.44 | 35.6 | Asan |
| 20 | 0.128 | 50.0 | -1.28 | 37.2 | Asan |
| 21 | 0.163 | 52.5 | -1.13 | 38.7 | Asan |
| 22 | 0.196 | 55.0 | -0.98 | 40.2 | Asan |
| 23 | 0.225 | 57.5 | -0.83 | 41.7 | Asan |
| 24 | 0.272 | 60.0 | -0.67 | 43.3 | Asan |
| 25 | 0.319 | 62.5 | -0.52 | 44.8 | Asan |
| 26 | 0.374 | 65.0 | -0.37 | 46.3 | Asan |
| 27 | 0.426 | 67.5 | -0.22 | 47.8 | Asan |
| 28 | 0.472 | 70.0 | -0.06 | 49.4 | Asan |
| 29 | 0.517 | 72.5 | 0.09 | 50.9 | Asan |
| 30 | 0.577 | 75.0 | 0.24 | 52.4 | Asan |
| 31 | 0.628 | 77.5 | 0.39 | 53.9 | Asan |
| 32 | 0.679 | 80.0 | 0.54 | 55.4 | Asan |
| 33 | 0.736 | 82.5 | 0.70 | 57.0 | Asan |
| 34 | 0.803 | 85.0 | 0.85 | 58.5 | Asan |
| 35 | 0.851 | 87.5 | 1.00 | 60.0 | Asan |
| 36 | 0.896 | 90.0 | 1.15 | 61.5 | Asan |
| 37 | 0.938 | 92.5 | 1.31 | 63.1 | Asan |
| 38 | 0.971 | 95.0 | 1.46 | 64.6 | Asan |
| 39 | 0.990 | 97.5 | 1.61 | 66.1 | Asan |
| 40 | 1.000 | 100.0 | 1.76 | 67.6 | Asan |
Biz, həmin qayda ilə “Orta” və “Çətin” səviyyəli testlər üçün də cədvəllər düzəldəcəyik. Sonra isə həmin cədvəlləri alt-alta qoyub, hər üç səviyyəli testlər üçün bir ümumi “Cədvəl” alacayıq.
Orta səviyyəli test üçün cədvəlin düzəldilməsi
tosc <- sort(unique(Cəm_bal_Orta)) # Çəm balların səviyyələri
perc <- ecdf(Cəm_bal_Orta)(tosc) # Çəm balların persentillərı
sura <- round(100 * (tosc / max(Cəm_bal_Orta)),2) # Uğurluluq dərəcəsi
zsco <- round(sort(unique(scale(Cəm_bal_Orta))),2) # Z-ballar
tsco <- 50 + 10 * zsco # T-ballar
OS <- cbind(tosc, perc, sura, zsco, tsco)
OS <- as.tibble(OS)
Cədvəl_Orta <- OS %>%
mutate(Adi = "Orta")
knitr::kable(Cədvəl_Orta)
| tosc | perc | sura | zsco | tsco | Adi |
|---|---|---|---|---|---|
| 4 | 0.001 | 10.0 | -2.43 | 25.7 | Orta |
| 5 | 0.002 | 12.5 | -2.29 | 27.1 | Orta |
| 6 | 0.004 | 15.0 | -2.15 | 28.5 | Orta |
| 7 | 0.007 | 17.5 | -2.01 | 29.9 | Orta |
| 8 | 0.016 | 20.0 | -1.88 | 31.2 | Orta |
| 9 | 0.040 | 22.5 | -1.74 | 32.6 | Orta |
| 10 | 0.057 | 25.0 | -1.60 | 34.0 | Orta |
| 11 | 0.078 | 27.5 | -1.46 | 35.4 | Orta |
| 12 | 0.107 | 30.0 | -1.33 | 36.7 | Orta |
| 13 | 0.135 | 32.5 | -1.19 | 38.1 | Orta |
| 14 | 0.176 | 35.0 | -1.05 | 39.5 | Orta |
| 15 | 0.227 | 37.5 | -0.91 | 40.9 | Orta |
| 16 | 0.281 | 40.0 | -0.78 | 42.2 | Orta |
| 17 | 0.318 | 42.5 | -0.64 | 43.6 | Orta |
| 18 | 0.366 | 45.0 | -0.50 | 45.0 | Orta |
| 19 | 0.422 | 47.5 | -0.36 | 46.4 | Orta |
| 20 | 0.466 | 50.0 | -0.22 | 47.8 | Orta |
| 21 | 0.509 | 52.5 | -0.09 | 49.1 | Orta |
| 22 | 0.562 | 55.0 | 0.05 | 50.5 | Orta |
| 23 | 0.600 | 57.5 | 0.19 | 51.9 | Orta |
| 24 | 0.642 | 60.0 | 0.33 | 53.3 | Orta |
| 25 | 0.693 | 62.5 | 0.46 | 54.6 | Orta |
| 26 | 0.726 | 65.0 | 0.60 | 56.0 | Orta |
| 27 | 0.765 | 67.5 | 0.74 | 57.4 | Orta |
| 28 | 0.807 | 70.0 | 0.88 | 58.8 | Orta |
| 29 | 0.836 | 72.5 | 1.01 | 60.1 | Orta |
| 30 | 0.869 | 75.0 | 1.15 | 61.5 | Orta |
| 31 | 0.894 | 77.5 | 1.29 | 62.9 | Orta |
| 32 | 0.919 | 80.0 | 1.43 | 64.3 | Orta |
| 33 | 0.940 | 82.5 | 1.56 | 65.6 | Orta |
| 34 | 0.955 | 85.0 | 1.70 | 67.0 | Orta |
| 35 | 0.974 | 87.5 | 1.84 | 68.4 | Orta |
| 36 | 0.984 | 90.0 | 1.98 | 69.8 | Orta |
| 37 | 0.993 | 92.5 | 2.12 | 71.2 | Orta |
| 38 | 0.997 | 95.0 | 2.25 | 72.5 | Orta |
| 39 | 0.998 | 97.5 | 2.39 | 73.9 | Orta |
| 40 | 1.000 | 100.0 | 2.53 | 75.3 | Orta |
Çətin səviyyəli test üçün cədvəlin düzəldilməsi
tosc <- sort(unique(Cəm_bal_Çətin)) # Çəm balların səviyyələri
perc <- ecdf(Cəm_bal_Çətin)(tosc) # Çəm balların persentillərı
sura <- round(100 * (tosc / max(Cəm_bal_Çətin)),2) # Uğurluluq dərəcəsi
zsco <- round(sort(unique(scale(Cəm_bal_Çətin))),2) # Z-ballar
tsco <- 50 + 10 * zsco # T-ballar
ÇS <- cbind(tosc, perc, sura, zsco, tsco)
ÇS <- as.tibble(ÇS)
Cədvəl_Çətin <- ÇS %>%
mutate(Adi = "Çətin")
knitr::kable(Cədvəl_Çətin)
| tosc | perc | sura | zsco | tsco | Adi |
|---|---|---|---|---|---|
| 2 | 0.001 | 5.26 | -2.04 | 29.6 | Çətin |
| 3 | 0.004 | 7.89 | -1.88 | 31.2 | Çətin |
| 4 | 0.011 | 10.53 | -1.72 | 32.8 | Çətin |
| 5 | 0.032 | 13.16 | -1.56 | 34.4 | Çətin |
| 6 | 0.053 | 15.79 | -1.40 | 36.0 | Çətin |
| 7 | 0.095 | 18.42 | -1.25 | 37.5 | Çətin |
| 8 | 0.148 | 21.05 | -1.09 | 39.1 | Çətin |
| 9 | 0.213 | 23.68 | -0.93 | 40.7 | Çətin |
| 10 | 0.271 | 26.32 | -0.77 | 42.3 | Çətin |
| 11 | 0.347 | 28.95 | -0.61 | 43.9 | Çətin |
| 12 | 0.417 | 31.58 | -0.45 | 45.5 | Çətin |
| 13 | 0.490 | 34.21 | -0.30 | 47.0 | Çətin |
| 14 | 0.552 | 36.84 | -0.14 | 48.6 | Çətin |
| 15 | 0.603 | 39.47 | 0.02 | 50.2 | Çətin |
| 16 | 0.647 | 42.11 | 0.18 | 51.8 | Çətin |
| 17 | 0.691 | 44.74 | 0.34 | 53.4 | Çətin |
| 18 | 0.731 | 47.37 | 0.50 | 55.0 | Çətin |
| 19 | 0.769 | 50.00 | 0.65 | 56.5 | Çətin |
| 20 | 0.810 | 52.63 | 0.81 | 58.1 | Çətin |
| 21 | 0.839 | 55.26 | 0.97 | 59.7 | Çətin |
| 22 | 0.860 | 57.89 | 1.13 | 61.3 | Çətin |
| 23 | 0.886 | 60.53 | 1.29 | 62.9 | Çətin |
| 24 | 0.912 | 63.16 | 1.44 | 64.4 | Çətin |
| 25 | 0.930 | 65.79 | 1.60 | 66.0 | Çətin |
| 26 | 0.947 | 68.42 | 1.76 | 67.6 | Çətin |
| 27 | 0.962 | 71.05 | 1.92 | 69.2 | Çətin |
| 28 | 0.975 | 73.68 | 2.08 | 70.8 | Çətin |
| 29 | 0.981 | 76.32 | 2.24 | 72.4 | Çətin |
| 30 | 0.985 | 78.95 | 2.39 | 73.9 | Çətin |
| 31 | 0.988 | 81.58 | 2.55 | 75.5 | Çətin |
| 32 | 0.992 | 84.21 | 2.71 | 77.1 | Çətin |
| 33 | 0.996 | 86.84 | 2.87 | 78.7 | Çətin |
| 35 | 0.998 | 92.11 | 3.19 | 81.9 | Çətin |
| 37 | 0.999 | 97.37 | 3.50 | 85.0 | Çətin |
| 38 | 1.000 | 100.00 | 3.66 | 86.6 | Çətin |
Yekun cədvəlin düzəldilməsi
Cədvəl <- rbind(Cədvəl_Asan, Cədvəl_Orta, Cədvəl_Çətin)
str(Cədvəl)
## tibble [104 × 6] (S3: tbl_df/tbl/data.frame)
## $ tosc: num [1:104] 9 10 11 12 13 14 15 16 17 18 ...
## $ perc: num [1:104] 0.001 0.003 0.005 0.016 0.021 0.028 0.035 0.049 0.064 0.086 ...
## $ sura: num [1:104] 22.5 25 27.5 30 32.5 35 37.5 40 42.5 45 ...
## $ zsco: num [1:104] -2.96 -2.81 -2.65 -2.5 -2.35 -2.2 -2.04 -1.89 -1.74 -1.59 ...
## $ tsco: num [1:104] 20.4 21.9 23.5 25 26.5 28 29.6 31.1 32.6 34.1 ...
## $ Adi : chr [1:104] "Asan" "Asan" "Asan" "Asan" ...
Bu yekun cədvəldən istifadə edərək, müxtəlif səviyyəli testləri, göstəricilərinə görə müqayisə edə bilərik
library(ggplot2)
g <- ggplot(Cədvəl, aes(Adi, perc))
g + geom_boxplot(aes(fill = Adi)) +
theme(axis.text.x = element_text(angle=65, vjust=0.6)) +
labs(title="Box plot",
x = "Səviyyələr",
y = "Persentil ranklar")
Persentil rankların sıxlıq qrafikləri
theme_set(theme_classic())
G2 <- ggplot(Cədvəl, aes(perc))
G2 + geom_density(aes(fill= factor(Adi), alpha=0.8)) +
labs(title = "Səviyyələr üzrə persentil ranqların sıxlıq qrafikləri",
x="Ballar")
Biz, əgər müxtəlif səviyyəli testlər üçün, ümumiyyətlə, Z-qiymətlərin və ya T-qiymətlərin paylanmalarını müqayisə etmək istəsək elə yuxarıda cəm ballar üçün aldığımız mənzərəni görməliyik. Çünki, bu qiymətlər və bu kimi bir çox törəmə ballar, cəm balların xətti çevrilmələrindən alınır. Xətti çevrilmələr isə paylanmanın formasını saxlayır. Lakin, bizim halda, bütün Z və T-qiymətlərə yox, onların yalnız onlardan müxtəlif olanlarına baxılır. Bu səbəbdən, onlardan birinin məsələn, T-qiymətlərin müxtəlif səfiyyəli testlər üzrə paylanmasına baxaq.
Müxtəlif səviyyəli testlərin T-ballarının bığlı-qutu təqdimatı
g <- ggplot(Cədvəl, aes(Adi, tsco))
g + geom_boxplot(aes(fill = Adi)) +
theme(axis.text.x = element_text(angle=65, vjust=0.6)) +
labs(title="Box plot",
x = "Səviyyələr",
y = "T-ballar")
Müxtəlif səviyyəli testlərin T-ballarının sıxlıq qrafikləri
theme_set(theme_classic())
G2 <- ggplot(Cədvəl, aes(tsco))
G2 + geom_density(aes(fill= factor(Adi), alpha=0.8)) +
labs(title = "Səviyyələr üzrə T-balların sıxlıq qrafikləri",
x="Ballar")
Tapşırığın analizi dedikdə, tapşırığın çətinlik dərəcəsi və ayırdetmə gücünün əsasında, onun testdə qalması, yaxud kənarlaşdırılması qərarının verilməsi naminə aparılan statistik prosedur başa düşülür.
Tapşırıqların analızində aşağıdakı hədəflər güdülür:
Final testin tərtibi üçün tapşırıqların seçilməsi;
Bütün tapşırıqlar üçün çətinlik dərəcələrinin müəyyən edilməsi;
Bütün tapşırıqlar üçün ayrıdetmə əmsalının müəyyən edilməsi;
Tərtibinə və sözlə ifadə olunmasına yenidən baxılmasına ehtiyac olan tapşırıqların aşkarlanması;
Tələb olunan xüsusiyyətə malik test üçün tapşırıqların seçilməsi.
Klassik Test Nəzəriyyəsi çərçivəsində test tapşırıqlarının analizində aşağıdakılara baxılır:
Tapşırığın çətinlik dərəcəsinə, yaxud p-qiymətlər-ə (Item difficulty or p-values);
Tapşırığın ayırdetmə əmsalına (Item discrimination);
Tapşırığa cavabla, testə cavabın, yəni tapşırığa cavabların cəmi ilə korrelyasıyaya (Item- test correlation);
Tapşırığa cavabla, bu tapşırıqsız testə cavabın (The item-rest correlation) korrelyasıyasına;
Distraktorlarla cəm balların korrelyasiyasına;
Tapşırıqların qrafik analizinə;
Tapşırıqların etibarlılığına;
Daxili razılaşdırma etibarlılığına;
Ölçmənin standart səhvinə (SEM).
Klassik test nəzəriyyəsində tapşırığın çətinlik dərəcəsi dedikdə, tapşırığa doğru cavabların bütün cavablar içində faizi başa düşülür. Beləliklə, konkret sualın çətinlik dərəcəsi sualın səviyyəsinin imtahanda iştirak edən kontingentin səviyyəsinə nə dərəcədə uyğun olduğunu ifadə etmiş olur. Nəticədə, çətinlik dərəcələri birə və ya sıfra yaxın olan tapşırıqlar ölçülən sahə üzrə hazırlıqlı iştirakçıları, hazırlıqsız iştirakçılardan ayıra bilmir.
Hər bir tapşırığın çoxsaylı, müxtəlif parametrləri vardır ki, onlar da bu ya diğər dərəcədə onun çətinlik dərəcəsi ilə əlaqəlidir.
Göstərmək olar ki, dixotomik tapşırıq özünün dəyişkənliyinin yəni, dispersiyasının maksimum qiymətini çətinlik dərəcəsi \(p = \frac{1}{2}\) olduqda alır. Yəni, tapşırığın klassik mənada çətinliyi özünün orta qiymətinə yaxın olduqca, dəyişkənliyi də çox olur. Biz dixotomik tapşırığın çətinlik dərəcəsini p ilə işarə etsək, onda onun dispersiyasının p(1-p) olduğunu təsadüfü dəyişənlər bölməsindən bilirdik. Bu tam olmayan kvadrat üçhədlinin hansı nöqtədə maksimum qiymət aldığını araşdıraq.
\[p(1-p) = p-p^2 = -(p^2 - p) = - ((p-\frac{1}{2})^2-\frac{1}{4})=-(p-\frac{1}{2})^2+\frac{1}{4} \]
Buradan görünür ki, dispersiya özünün maksimum qiymətini \(p=\frac{1}{2}\) olduqda alır. Beləliklə, çətinlik dərəcələri \(p=\frac{1}{2}\)-ə yaxın olan dixotomik tapşırıqlarin dispersiyaları daha çox olur.
Aşağıdakı cədvəldə tapşırıqların çətinlik dərəcələrinə görə təsnifatı verilmişdir.
Çətinlik dərəcələrinə görə tapşırığın dəyərləndirilməsi
| Tapşırığın çətinliyi | Tapşırığın dəyərləndirilməsi |
|---|---|
| 0.20 - 0.30 | Çox çətin |
| 0.31 - 0.40 | Çətin |
| 0.41 - 0.60 | Orta çətinlikli |
| 0.61 - 0.70 | Asan |
| 0.71 - 0.80 | Çox asan |
Hər bir test tapşırığının ikinci ən vacib parametri onun ayrıdetmə əmsalıdır. Əksər halda tapşırığın testdə qalması və ya çıxarılması qərarı məhz bu göstəricinin əsasında verilir.
Tapşırığın ayrıdetmə tipləri:
Ayrıdetmə sıfırdır, yaxud yoxdur;
Ayrıdetmə əmsalı müsbətdir;
Ayrıdetmə əmsalı mənfidir.
Ayrıdetmə sıfırdır, yaxud yoxdur-bütün iştirakçılar tapşırığa doğru cavab verdikdə və ya əksinə, bütün iştirakçılar tapşırığa doğru cavab vermədikdə və bir sıra digər hallarda bu baş verir. Bu halda, tapşırığa yenidən baxılmalı, yaxud həmin tapşırıq testdən çıxarılmalıdır.
Ayrıdetmə əmsalı müsbətdir-bu halda, tapşırığa yoxlanılan sahə üzrə hazırliqlı iştirakçılar yoxlanılan sahə üzrə hazırliqsız iştirakçılara nisbətən yaxşı cavab veriblər.
Ayrıdetmə əmsalı mənfidir-bu halda, tapşırığa yoxlanılan sahə üzrə hazırliqlı iştirakçılar, yoxlanılan sahə üzrə hazırliqsız iştirakçılara nisbətən pis cavab veriblər.
Tapşırıqların ayrıdetmə əmsallarının təsnifatı.
Ayrıdetmə əmsalının qiymətinə görə tapşırığın dəyərləndirilməsi (Ebelə görə)
| Tapşırığın ayrıdetməsi | Tapşırığın dəyərləndirilməsi |
|---|---|
| >= 0.40 | Çox yaxşıdır |
| 0.30 <= 0.39 | Məğbuldurr |
| 0.20 <= 0.29 | Yaxşılaşdırılması zəruridir |
| <0.19 | Kənarlaşdırılmalıdır |
Test tapşırığının ayırdetmə əmsalı müxtəlif üsullarla hesablanır. Onlardan biri və əllə hesablanması qismən asan olanı aşağıdakı düsturla veriləndir. \[d_i = Y_i/n_iY-A_i/n_iA\]
Testləşmədə iştirak edənləri topladıqları cəm ballarını azalma sırasına görə düzürlər. Sonra, sıralamanın yuxarısındakı 27% -iştirakçıdan, tapşırığa doğru cavab verənlərin payından (\(Y_i/n_iY\)) sıralamanın aşağısındakı 27% -iştirakçının tapşırığa doğru cavab verənlərin payını (\(A_i/n_iA\)) çıxırlar. Burada “Y” -hərfi yuxarı sözünün baş hərfi, “A” -hərfi aşağı sözünün baş hərfidir. Burada verilən 27%- normal paylanmanın paylanma xüsusiyyəti ilə əlaqəlidir (Kelly).
Burada, \(n_i(Y)\) və \(n_i(A)\) uyğun olaraq, yuxarı və aşağı qruplardakı iştirakçıların, \(Y_i\) və \(A_i\) yuxarı və aşağı qruplarda i-ci tapşırığa doğru cavab verənlərin sayıdır.
Tapşırığın ayrıdetmə əmsalının hesablanmasının digər alternativ yolu tapşırığa cavabla testin cəm balı arasında nöqtəvi-biserial korrelyasiyadır (item-total test-score point-biserial correlation). Burada tapşırığa cavab dixotomik şkalada, testin cəm balı isə ya interval ya da nizam şkalasında olur. Bu səbəbdən, Pirson korrelyasiya əmsalı düsturu dəyişərək aşağıdakı şəkli alır. \[r_{iX} =\frac{\bar{X_{i}}-\bar{X}}{S_X} \cdot \sqrt{\frac{p_i}{1-p_i}}\] Burada,
\(X_{i}\)- tapşırığa doğru cavabların payı, yəni doğru cavab verənlərin sayının tərs qiyməti;
\(p_{i}\)- tapşırığın çətinlik dərəcəsi;
\(\overline{X}\)- Testin cəm ballarının orta qiyməti;
\(\sigma_{X}\)- Testin cəm ballarının orta kvadratik meyli.
Bir qayda olaraq ayrıdetmə əmsalı \(0.2\)-dən kiçiki olan tapşırıqlar testən çıxarılmalıdır (Allen 1979).
Yuxarıda ayrıdetmə əmsalının hesablanmsı üçün verilən hər iki düsturun nəticəsi müsbət olmalıdır. Əgər, bu göstəricilər hansısa bir tapşırıq üçün mənfi qiymət alırsa, onda həmin tapşırıq yerdə qalan digər tapşırıqların ölçdüyünün əksini ölçür. Bu halda ya tapşırıq düzgün ifadə edilməyib ya düzgün kodlaşmayıb və sairə.
Bəzən, tapşırığa cavab cəm ballarla korrelyasiya etmədiyi halda, tapşırığa cavabla cəm balların nöqtəvi-biserial korrelyasiyası müsbət ola bilir. Bu halın aradan qaldırılması məqsədilə cəm ballar hesablanarkən tapşırığın cavabları cəm ballara daxil edilmir. Tapşırıqların nəticələrinin analizinə aid əksər proqramlarda, hər iki göstərici ayri-ayrılıqda verilir. Yəni, tapşırığa cavablar cəm ballara daxil edildikdə həm də daxil edilmədikdə ayrıdetmə əmsalları hesablanır.
Qapalı test tapşırıqları müxtəlif növ biliklərin və təlim nəticələrinin ölçülməsində istifadə oluna bilir. Bu növ test tapşırıqları vasitəsilə Blumun təsnifatının çox hissəsinə (bilmə, başa düşmə, tətbiq etmə, analiz) aid olanları ölçmək mümkündür.
Təlimin müxtəlif səviyyələrindəki nailiyyətlərin ölçülməsi üçün qapalı test tapşırıqlarının müxtəlif formatları vardır. Tapşırıqların hansı tipinin (cavabı verilən variantlardan birinin seçimini, “doğru-yalan”-ın müəyyən edilməsini tələb edən, verilən seriyalar arasında uyğunluq yaratmaq və sairə) tətbiq edilməsinə baxıldıqda isə yəqin ki, effektif üsul kimi cavabı verilən alternativ variantlardan birinin seçimini tələb edən formatdan başlamaq lazımdır. Bu zaman, baxılan məzmun və təlim sahəsi belə formatın tətbiqinə imkan vermədikdə digər formatlardan istifadə oluna bilər. Məsələn, alternativ varıant kimi, yalnız iki mümkün variant vardırsa onda “doğru-yalan” formatının seçilməsinə üstünlük verilməlidir və sairə.
Cavabı verilən variantlardan seçim tələb edən test tapşırıqlarının güclü tərəfləri:
Sadədən mürəkkəbə kimi geniş çeşidli təlim nəticələrini ölçmək olur;
Yüksək tələblərə cavab verən struktura malik, aydın yazılmış tapşırıqlar qurmaq mümkündür;
Doğru olmayan alternativ cavablardan tapşırıqların təhlilində diagnostik məlumat kimi istifadə etmək olur;
Cavab variantlarının sayı çoxaldıqca doğru cavabı təxminetmə ehtimalı azalır;
Alınan ballar, digər ballaşmalarda (məsələn, “esse”- lərdə) olduğundan etibarlidir;
Ballaşma obyektivdir, əldə edilməsi asan və keyfiyyətcə etibarlidir;
Tapşırıqların analizi, hər bir tapşırığın çətinlik dərəcəsini, həmçinin ölçülən sahə üzrə güclü və zəif iştirakçıları ayırmağa imkan verən “ayırdetmə” əmsalını hesablamağa imkan verir;
Iştirakçıların nətəcələrini müxtəlif qruplar və dövrlər üzrə müqayisə etmək mümkündür;
Bir tapşırığın həllinə nəzərdə tutulan müddət az olduğundan bir imtahan müddətində çoxlu sahəni əhatə etmək mümkündür;
Tapşırıqlar elə formalaşdırıla bilər ki, cavablar müxtəlif səviyyələrdə qismən doğru olsun.
Cavabı verilən variantlardan seçim tələb edən test tapşırıqlarının zəif tərəfləri
Keyfiyyətli tapşırığın yazılması çox vaxt və vəsait tələb edən prosesdir;
Işləyən distraktorların tapılıması və yazılması çox vaxt çətin, bəzən də heç mümkün olmayan prosesdir;
Bu növ tapşırıqlarla bir cox idrakı bacarıqları, xüsusən Blumun təsnifatındakı yüksək səviyyədə olanları formalaşdırmaq və ölçmək mümkün olmur.
Distractorlar üzrə analizdə, adətən iştirakçılar yığdıqları cəm ballara görə müəyyən sayda qruplara bölünürlər. Belə bölmələr çox vaxt “yuxarı”, “orta” və “aşağı” kimi üç hissədən ibarət olur. Sonra, bu qruplar üzrə hər bir tapşırığın doğru cavabının və distraktorlarının payı hesablanır.
Aydındır ki və sağlam düşüncəyə görə də qruplar üzrə tapşırığa doğru cavabların payı qrupların hazırlıq səviyyələri artdıqca artmalı, distraktorları seçənlərin payı isə qrupların hazırlıq səviyyələri artdıqca azalmalıdır. Bu drumun pozulduğu bütün hallara yenidən baxılmalı və vəziyyət araşdırılmalıdır.
Bundan başqa, distraktorları seçənlərin payı, yaxud faizi müəyyən bəlli həddən az olmalıdır. Məsələn, 5%-dən az olmalı deyil. Əks halda, distraktor iştirakçılar üçün cəlbedici hesab edilmir və əvəzedilməsi məsləhət bilınir.
Yuxarı qrupda doğru cavabı seçənlərin faizi ayrılıqda hər bir distraktoru seçənlərin faizindən çox olmalıdır.
Tapşırığın final testə seçilməsi üçün ümumi qaydalar:
Yalnız ayrıdetmə əmsalı 0.2-dən böyük olanlar seçilir;
Ayrıdetmə əmsalı 0.2-dən kiçik olanlara ya yenidən baxılmalı ya testdən çıxarılmalıdır;
Çox çətin və çox asan tapşırıqlar testə seçilmir.
Tapşırığın çətinliyi ilə onun ayrıdetməsi arasında əlaqə:
Bu göstəricilər bir-birlərini inkar etmirlər, əksinə biri digərini tamamlayır;
Yaxşı tapşırığın seçilməsində hər ikisindən istifadə olunmalıdır;
Əgər, tapşırığın ayrıdetməsi sıfır yaxud mənfidirsə, onda çətinlik dərəcəsindən asılı olmayaraq həmin tapşırıq testdən çıxarılır.
“epmr” paketindən istifadə etməklə tapşırıqların analizi. Paketi buradan, epmr yükləyə bilərsiz.
Əvvəlcə, yuxarıda artıq istifadə etdiyimiz çətinliklərinə ğörə fərqlənən üç datanı (Asan, Orta və Çətin) R-a yükləyək.
library(readr)
Asan <- read_csv("Asan.csv")
Orta <- read_csv("Orta.csv")
Çətin <- read_csv("Çətin.csv")
Biz cəm ballarının təsviri statistikası üçün paketin “dstudy” funksiyasından istifadə edək. Burada cəm balların təsviri statistikası nisbətən yığcam formada verilmişdir. Nəticə kimi verilən cədvəldə orta qiymət, median, standart yayınma, əyrilik, diklik, minimum bal, maksimum bal, imtahan verənlərin sayı və cavabı olmayan tapşırıqların sayı verilir.
dstudy(rowSums(Asan)) ## Asan səviyyəli testin təsviri cəm ballarının təsviri statistikası
##
## Descriptive Study
##
## mean median sd skew kurt min max n na
## x 28.4 29 6.57 -0.448 2.56 9 40 1000 0
dstudy(rowSums(Orta)) ## Orta səviyyəli testin təsviri cəm ballarının təsviri statistikası
##
## Descriptive Study
##
## mean median sd skew kurt min max n na
## x 21.6 21 7.26 0.154 2.28 4 40 1000 0
dstudy(rowSums(Çətin)) ## Çətin səviyyəli testin təsviri cəm ballarının təsviri statistikası
##
## Descriptive Study
##
## mean median sd skew kurt min max n na
## x 14.9 14 6.32 0.666 3.01 2 38 1000 0
Hər üş səviyyəli testin cəm ballarının təsviri statistikasın bir cədvəldə verək:
Təsviri_cədvəl <- rbind(Asan = dstudy(rowSums(Asan)),
Orta = dstudy(rowSums(Orta)),
Çətin= dstudy(rowSums(Çətin)))
Təsviri_cədvəl
##
## Descriptive Study
##
## mean median sd skew kurt min max n na
## Asan 28.4 29 6.57 -0.448 2.56 9 40 1000 0
## Orta 21.6 21 7.26 0.154 2.28 4 40 1000 0
## Çətin 14.9 14 6.32 0.666 3.01 2 38 1000 0
“epmr”-paketinin istudy funksiyasından istifadə edərək bü üç müxtəlif testin daxili razılaşdırma əmsalını tapaq. “epmr”-paketinin “istudy”-funksiyası tapşırıqların parametrləri və bütöv testin Kronbax alfası haqda məlumat verir. “istudy”-funksiyasının bir üstünlüyü də odur ki, tapşırıqların analizində verilməyən cavabların statistikası da aparılır.
Tapşırıqların analizində verilən göstəricilərin adları:
m -tapşırığa cavabın orta qiyməti;
sd -tapşırığa cavabın standart meyli;
n -iştirakçıların sayı;
na -tapşırığa cavab verməyənlərin sayı;
itc -tapşırığa cavabla cəm balin korrelyasiyası;
citc -tapşırıq daxıl olmadan tapşırığa cavabla cəm balin korrelyasiyası;
aid tapşırıq daxıl olmadan Kronbax alfası.
istudy(Asan)
##
## Scored Item Study
##
## Alpha: 0.8392
##
## Item statistics:
## m sd n na itc citc aid
## Tapsh-1 0.637 0.481 1000 0 0.403 0.339 0.835
## Tapsh-2 0.668 0.471 1000 0 0.352 0.287 0.836
## Tapsh-3 0.873 0.333 1000 0 0.318 0.272 0.837
## Tapsh-4 0.545 0.498 1000 0 0.362 0.294 0.836
## Tapsh-5 0.637 0.481 1000 0 0.366 0.300 0.836
## Tapsh-6 0.828 0.378 1000 0 0.399 0.349 0.835
## Tapsh-7 0.638 0.481 1000 0 0.374 0.309 0.836
## Tapsh-8 0.831 0.375 1000 0 0.360 0.309 0.836
## Tapsh-9 0.807 0.395 1000 0 0.280 0.223 0.838
## Tapsh-10 0.840 0.367 1000 0 0.305 0.254 0.837
## Tapsh-11 0.808 0.394 1000 0 0.315 0.259 0.837
## Tapsh-12 0.617 0.486 1000 0 0.444 0.382 0.834
## Tapsh-13 0.559 0.497 1000 0 0.377 0.309 0.836
## Tapsh-14 0.827 0.378 1000 0 0.401 0.351 0.835
## Tapsh-15 0.668 0.471 1000 0 0.323 0.257 0.837
## Tapsh-16 0.862 0.345 1000 0 0.321 0.273 0.837
## Tapsh-17 0.669 0.471 1000 0 0.320 0.253 0.837
## Tapsh-18 0.499 0.500 1000 0 0.475 0.413 0.833
## Tapsh-19 0.597 0.491 1000 0 0.498 0.439 0.832
## Tapsh-20 0.791 0.407 1000 0 0.360 0.305 0.836
## Tapsh-21 0.628 0.484 1000 0 0.376 0.310 0.836
## Tapsh-22 0.593 0.492 1000 0 0.449 0.386 0.834
## Tapsh-23 0.749 0.434 1000 0 0.334 0.273 0.837
## Tapsh-24 0.735 0.442 1000 0 0.397 0.338 0.835
## Tapsh-25 0.699 0.459 1000 0 0.337 0.272 0.837
## Tapsh-26 0.625 0.484 1000 0 0.368 0.301 0.836
## Tapsh-27 0.760 0.427 1000 0 0.376 0.319 0.836
## Tapsh-28 0.568 0.496 1000 0 0.392 0.325 0.835
## Tapsh-29 0.802 0.399 1000 0 0.437 0.386 0.834
## Tapsh-30 0.811 0.392 1000 0 0.317 0.261 0.837
## Tapsh-31 0.725 0.447 1000 0 0.304 0.241 0.838
## Tapsh-32 0.652 0.477 1000 0 0.450 0.390 0.834
## Tapsh-33 0.778 0.416 1000 0 0.376 0.320 0.836
## Tapsh-34 0.709 0.454 1000 0 0.381 0.320 0.836
## Tapsh-35 0.687 0.464 1000 0 0.434 0.374 0.834
## Tapsh-36 0.639 0.481 1000 0 0.327 0.260 0.837
## Tapsh-37 0.680 0.467 1000 0 0.356 0.291 0.836
## Tapsh-38 0.888 0.316 1000 0 0.359 0.316 0.836
## Tapsh-39 0.780 0.414 1000 0 0.393 0.337 0.835
## Tapsh-40 0.717 0.451 1000 0 0.324 0.261 0.837
istudy(Orta)
##
## Scored Item Study
##
## Alpha: 0.842
##
## Item statistics:
## m sd n na itc citc aid
## Tapsh-1 0.576 0.494 1000 0 0.397 0.337 0.838
## Tapsh-2 0.652 0.477 1000 0 0.386 0.329 0.838
## Tapsh-3 0.779 0.415 1000 0 0.276 0.222 0.841
## Tapsh-4 0.573 0.495 1000 0 0.348 0.286 0.839
## Tapsh-5 0.411 0.492 1000 0 0.409 0.351 0.838
## Tapsh-6 0.413 0.493 1000 0 0.431 0.374 0.837
## Tapsh-7 0.620 0.486 1000 0 0.313 0.251 0.840
## Tapsh-8 0.497 0.500 1000 0 0.365 0.304 0.839
## Tapsh-9 0.706 0.456 1000 0 0.429 0.376 0.837
## Tapsh-10 0.411 0.492 1000 0 0.351 0.289 0.839
## Tapsh-11 0.426 0.495 1000 0 0.414 0.356 0.838
## Tapsh-12 0.585 0.493 1000 0 0.441 0.383 0.837
## Tapsh-13 0.417 0.493 1000 0 0.364 0.303 0.839
## Tapsh-14 0.342 0.475 1000 0 0.406 0.350 0.838
## Tapsh-15 0.478 0.500 1000 0 0.344 0.281 0.839
## Tapsh-16 0.694 0.461 1000 0 0.383 0.327 0.838
## Tapsh-17 0.441 0.497 1000 0 0.396 0.337 0.838
## Tapsh-18 0.413 0.493 1000 0 0.412 0.353 0.838
## Tapsh-19 0.480 0.500 1000 0 0.311 0.247 0.840
## Tapsh-20 0.499 0.500 1000 0 0.372 0.311 0.839
## Tapsh-21 0.549 0.498 1000 0 0.386 0.326 0.838
## Tapsh-22 0.633 0.482 1000 0 0.437 0.380 0.837
## Tapsh-23 0.699 0.459 1000 0 0.362 0.306 0.839
## Tapsh-24 0.427 0.495 1000 0 0.375 0.315 0.839
## Tapsh-25 0.533 0.499 1000 0 0.389 0.328 0.838
## Tapsh-26 0.446 0.497 1000 0 0.287 0.222 0.841
## Tapsh-27 0.474 0.500 1000 0 0.430 0.371 0.837
## Tapsh-28 0.618 0.486 1000 0 0.399 0.340 0.838
## Tapsh-29 0.447 0.497 1000 0 0.353 0.291 0.839
## Tapsh-30 0.456 0.498 1000 0 0.357 0.295 0.839
## Tapsh-31 0.615 0.487 1000 0 0.349 0.288 0.839
## Tapsh-32 0.629 0.483 1000 0 0.347 0.286 0.839
## Tapsh-33 0.405 0.491 1000 0 0.338 0.276 0.840
## Tapsh-34 0.571 0.495 1000 0 0.421 0.363 0.837
## Tapsh-35 0.610 0.488 1000 0 0.480 0.426 0.836
## Tapsh-36 0.549 0.498 1000 0 0.371 0.309 0.839
## Tapsh-37 0.640 0.480 1000 0 0.307 0.245 0.840
## Tapsh-38 0.456 0.498 1000 0 0.363 0.301 0.839
## Tapsh-39 0.722 0.448 1000 0 0.353 0.297 0.839
## Tapsh-40 0.742 0.438 1000 0 0.284 0.227 0.841
istudy(Çətin)
##
## Scored Item Study
##
## Alpha: 0.7944
##
## Item statistics:
## m sd n na itc citc aid
## Tapsh-1 0.371 0.483 1000 0 0.275 0.202 0.792
## Tapsh-2 0.305 0.461 1000 0 0.391 0.327 0.788
## Tapsh-3 0.368 0.483 1000 0 0.370 0.301 0.789
## Tapsh-4 0.492 0.500 1000 0 0.375 0.304 0.789
## Tapsh-5 0.607 0.489 1000 0 0.369 0.299 0.789
## Tapsh-6 0.419 0.494 1000 0 0.384 0.315 0.788
## Tapsh-7 0.289 0.454 1000 0 0.306 0.239 0.791
## Tapsh-8 0.272 0.445 1000 0 0.338 0.273 0.790
## Tapsh-9 0.474 0.500 1000 0 0.315 0.241 0.791
## Tapsh-10 0.342 0.475 1000 0 0.296 0.225 0.792
## Tapsh-11 0.500 0.500 1000 0 0.419 0.350 0.787
## Tapsh-12 0.272 0.445 1000 0 0.279 0.212 0.792
## Tapsh-13 0.259 0.438 1000 0 0.368 0.306 0.789
## Tapsh-14 0.392 0.488 1000 0 0.421 0.355 0.787
## Tapsh-15 0.274 0.446 1000 0 0.249 0.181 0.793
## Tapsh-16 0.194 0.396 1000 0 0.346 0.289 0.790
## Tapsh-17 0.334 0.472 1000 0 0.256 0.185 0.793
## Tapsh-18 0.525 0.500 1000 0 0.393 0.324 0.788
## Tapsh-19 0.272 0.445 1000 0 0.350 0.286 0.790
## Tapsh-20 0.249 0.433 1000 0 0.322 0.259 0.790
## Tapsh-21 0.407 0.492 1000 0 0.248 0.173 0.794
## Tapsh-22 0.360 0.480 1000 0 0.260 0.188 0.793
## Tapsh-23 0.341 0.474 1000 0 0.348 0.280 0.790
## Tapsh-24 0.429 0.495 1000 0 0.436 0.369 0.786
## Tapsh-25 0.517 0.500 1000 0 0.347 0.274 0.790
## Tapsh-26 0.283 0.451 1000 0 0.246 0.178 0.793
## Tapsh-27 0.404 0.491 1000 0 0.312 0.240 0.791
## Tapsh-28 0.314 0.464 1000 0 0.232 0.161 0.794
## Tapsh-29 0.301 0.459 1000 0 0.388 0.324 0.788
## Tapsh-30 0.460 0.499 1000 0 0.350 0.278 0.790
## Tapsh-31 0.298 0.458 1000 0 0.288 0.220 0.792
## Tapsh-32 0.308 0.462 1000 0 0.271 0.202 0.792
## Tapsh-33 0.412 0.492 1000 0 0.362 0.292 0.789
## Tapsh-34 0.498 0.500 1000 0 0.341 0.268 0.790
## Tapsh-35 0.272 0.445 1000 0 0.324 0.259 0.790
## Tapsh-36 0.382 0.486 1000 0 0.446 0.381 0.786
## Tapsh-37 0.423 0.494 1000 0 0.427 0.360 0.787
## Tapsh-38 0.397 0.490 1000 0 0.331 0.260 0.790
## Tapsh-39 0.515 0.500 1000 0 0.295 0.220 0.792
## Tapsh-40 0.340 0.474 1000 0 0.231 0.159 0.794
“istudy”- funksiyası vasitəsilə yalnız Kronbax alfasının tapılması
istudy(Asan)[2]
## $alpha
## [1] 0.8392362
istudy(Orta)[2]
## $alpha
## [1] 0.8420486
istudy(Çətin)[2]
## $alpha
## [1] 0.7943831
Asan səviyyəli testin Kronbax alfası-0.8392362, Orta səviyyəli testin Kronbax alfası-0.8420486, Çətin səviyyəli testin Kronbax alfası-0.7943831-dir. Beləlioklə, daxili razılaşdırma əmsalına görə ən yaxşı test Orta səviyyəli test olur.
“epmr”-paketinin ostudy -funksiyası, iştirakçıları səviyyələrinə görə üç yerə bölür. Sonra hər bir hissədə tapşırığa cavab verənlərin sayını və ya faizini hesablayır.
Aşağıda, növbəti baxacağımız, ShinyItemAnalysis-paketində tapşırıqların analizinə daha geniş baxılır (Əslində, orada “psych” paketinin funksiyalarından istifadə olunur). “ShinyItemAnalysis”-paketində tapşırığa həm doğru cavabın, həm də distraktorların seçimdən asılı olaraq, müxtəlif səviyyələr üzrə cavbabların sayına və faizinə baxılır.
Aşağıda 1-ci, 10-cu və 20-ci tapşırıqların 3 səviyyə üzrə cavablarının sayina baxılır.
ostudy(Asan[c(1, 10, 20)], scores = rowSums(Asan))
## $counts
## $counts$`Tapsh-1`
## groups
## low mid high
## 0 214 106 43
## 1 160 199 278
##
## $counts$`Tapsh-10`
## groups
## low mid high
## 0 102 41 17
## 1 272 264 304
##
## $counts$`Tapsh-20`
## groups
## low mid high
## 0 133 59 17
## 1 241 246 304
##
##
## $rowpct
## $rowpct$`Tapsh-1`
## groups
## low mid high
## 0 59 29 12
## 1 25 31 44
##
## $rowpct$`Tapsh-10`
## groups
## low mid high
## 0 64 26 11
## 1 32 31 36
##
## $rowpct$`Tapsh-20`
## groups
## low mid high
## 0 64 28 8
## 1 30 31 38
##
##
## $colpct
## $colpct$`Tapsh-1`
## groups
## low mid high
## 0 57 35 13
## 1 43 65 87
##
## $colpct$`Tapsh-10`
## groups
## low mid high
## 0 27 13 5
## 1 73 87 95
##
## $colpct$`Tapsh-20`
## groups
## low mid high
## 0 36 19 5
## 1 64 81 95
Burada 3 tapşırığa (1-ci, 10-cu və 20-ci tapşırıqlar) cavabların üç səviyyə üzrə sayı və faizləri verilmişdir. Bizim baxdığımız və özümüz törətdiyimiz asan səviyyəli datada (Asan səviyyəli test) cavabı verilməyən tapşırıq yoxdur. Yuxarıda, I cədvəldə I tapşırığın cavablarının səviyyələr üzrə sayı verilmişdir. Belə ki birinci sətirdə 0-bal alanların aşağı, orta və yuxarı səviyyələr üzrə sayı 214, 106 və 43 durur. İkinci sətirdə 1-bal alanların aşağı, orta və yuxarı səviyyələr üzrə sayı 160, 199 və 43 durur.
İkinci cədvəl baxmaq istədiyimiz 10-nömrəli tapşırığa, sırada üçüncü cədvəl, baxmaq istədiyimiz 20-nömrəli tapşırığa aiddir.
Sonra, həmin tapşırıqların səviyyələr üzrə cavablarının faizləri verilir.
Bu paketi buradan, CTT yükləyə bilərsiz. Paketin vasitəsilə Klassik Test Nəzəriyyəsi çərçıvəsində digər əməliyyatlarla yanaşı, aşağıdakıları da etmək mümkündür:
Cavabı alternativ verilənlərdən seçim tələb edən tapşırıqların ballaşdırması;
Etibarlılıq analizinın aparılması;
Tapşırıqların statistik təhlili;
Test ballarının bir şkaladan diqər şkalaya keçirılməsi.
Cavabı alternativ verilənlərdən seçim tələb edən tapşırıqları ballaşdırmaq, test analizinin ilkin mərhələləsidir. Belə ki, adətən, testin cavabı çiy formada olur və testi müşahidə edən qoşma sənəddə onun açarı da (Codbook) verilir. Bu açarda hər bir tapşırığın doğru cavabi göstərilir. Tapşırığa cavablar seçimdən asılı olaraq ya böyük ya kiçik hərflərlə ya da rəqəmlərlə göstərilə bilər.
Testin, hərtərəfli analizi üçün onun çiy formasına da baxılmalıdır. Məsələn, distraktorların analizinə məhz, bu formada baxmaq olur.
Bizim süni surətdə üç çətinlik səviyyəsində törətdiyimiz və yuxarıda istifadə etdiyimiz datalar (Asan, Orta və Çətin) bu məqsədə yaramır. Beləki, onlar artıq ballaşdırılmış testlərdir. Bu səbəbdən biz CTT paketinin içinə tikilən çiy datadan (CTTdata) və onun açarından (CTTkey) istifadə edəcəyik. (Qeyd edək ki R-da müxtəlif proqramların köməyilə müxtəlif çətinlik səviyyələri olan çiy datalar da törətmək mümkündür.)
Əvvəlcə, “CTT”- paketini kompüterə, sonra isə R-a yükləyin.
library(CTT)
##
## Attaching package: 'CTT'
## The following objects are masked from 'package:psych':
##
## polyserial, reliability
Bizə lazım olan data CTTdata -datası paketin içərisindədir. (Example Multiple-Choice Data). Bu datada 20 ballaşmamış tapşırıq, 100 cavab verən vardır.
data(CTTdata)
Hər bir datanı R-a yüklədikdən sonra ona baxılmasi məsləhətdir. Məsələn, str funksiyası ilə yaxud glimpse funksiyası ilə.
str(CTTdata)
## 'data.frame': 100 obs. of 20 variables:
## $ i1 : chr "A" "C" "B" "C" ...
## $ i2 : chr "B" "D" "D" "C" ...
## $ i3 : chr "B" "A" "C" "D" ...
## $ i4 : chr "B" "D" "D" "D" ...
## $ i5 : chr "B" "C" "A" "D" ...
## $ i6 : chr "C" "B" "B" "A" ...
## $ i7 : chr "B" "D" "A" "A" ...
## $ i8 : chr "C" "B" "C" "D" ...
## $ i9 : chr "B" "D" "B" "D" ...
## $ i10: chr "D" "A" "D" "D" ...
## $ i11: chr "D" "D" "B" "A" ...
## $ i12: chr "C" "D" "A" "B" ...
## $ i13: chr "A" "A" "A" "C" ...
## $ i14: chr "B" "B" "D" "B" ...
## $ i15: chr "A" "C" "D" "D" ...
## $ i16: chr "D" "C" "A" "B" ...
## $ i17: chr "B" "C" "B" "C" ...
## $ i18: chr "D" "A" "C" "B" ...
## $ i19: chr "A" "D" "B" "C" ...
## $ i20: chr "C" "C" "B" "A" ...
Datanın qruluşundan görünür ki, burada 20 tapşırığa 100 nəfər cavab veribdir.
Açarın qruluşu
data(CTTkey)
CTTkey
## [1] "D" "C" "A" "D" "D" "A" "D" "B" "D" "A" "A" "D" "C" "C" "B" "C" "D" "A" "A"
## [20] "B"
Açar göründüyü kimi 20 elementdən ibarət vektor şəklindədir. Birinci yerdə birinci tapşırığın doğru cavabı, ikinci yerdə ikinci tapşırığın doğru cavabı və qalan yerlərdə müvaviq sıra nömrəli tapşırıqların doğru cavabları verilmişdir.
data(CTTdata) ## data
data(CTTkey) ## açar
myScores <- score(CTTdata,CTTkey,
output.scored=TRUE) ## Ballaşma
cttICC(myScores$score, myScores$scored[,2], colTheme="spartans", cex=1.5)
Distraktorların analizi (distractor.analysis)
data(CTTdata)
data(CTTkey)
# Nəticə .csv faylında verilir
distractorAnalysis(CTTdata,CTTkey, csvReport="Hello.csv")[1:3]
## $i1
## correct key n rspP pBis discrim lower mid50 mid75
## A A 19 0.19 -0.3289491 -0.2666667 0.2666667 0.2307692 0.20
## B B 21 0.21 -0.4253910 -0.3807018 0.4333333 0.1923077 0.08
## C C 13 0.13 -0.2635730 -0.1666667 0.1666667 0.1923077 0.12
## D * D 47 0.47 0.5354616 0.8140351 0.1333333 0.3846154 0.60
## upper
## A 0.00000000
## B 0.05263158
## C 0.00000000
## D 0.94736842
##
## $i2
## correct key n rspP pBis discrim lower mid50 mid75
## A A 21 0.21 -0.3125686 -0.3280702 0.4333333 0.07692308 0.16
## B B 15 0.15 -0.3460590 -0.2000000 0.2000000 0.26923077 0.08
## C * C 53 0.53 0.4707659 0.7614035 0.1333333 0.53846154 0.72
## D D 11 0.11 -0.3345127 -0.2333333 0.2333333 0.11538462 0.04
## upper
## A 0.1052632
## B 0.0000000
## C 0.8947368
## D 0.0000000
##
## $i3
## correct key n rspP pBis discrim lower mid50 mid75
## A * A 55 0.55 0.2299700 0.40877193 0.4333333 0.46153846 0.56
## B B 17 0.17 -0.2913848 -0.21403509 0.2666667 0.15384615 0.16
## C C 12 0.12 -0.1312768 -0.08070175 0.1333333 0.03846154 0.24
## D D 16 0.16 -0.2569262 -0.11403509 0.1666667 0.34615385 0.04
## upper
## A 0.84210526
## B 0.05263158
## C 0.05263158
## D 0.05263158
Biz, distraktorların analizləri üçün nəticələri yalnız, birinci 3 tapşırıq üçün veririk. Məsələn, birinci tapşırığa aid cədvəli şərh edək. Burada istifadə olunan hər bir tapşırığa 4 mümkün cavab vardır. Cavablar, A, B, C və D kimi işarə edilibdir.
Birinci tapşırığa doğru cavab, D-variantıdır. İkinci sütunda, “correct key” D-variantının qabağında “*“-işarəsi vardır;
İkinci sütunda, “n”-variantları seçənlərin sayıdır;
Üçüncü sütunda, “rspP”-variantı seçənlərin ümumi cavabda payıdır;
Dördüncü sütunda, “pBis”-varianta cavablarla cəm cavablar arasında nöqtəvi-biserial korrelyasiyadır (tapşırığa cavablar cəm ballara daxıl edilməmişdir);
Beşinci sütunda, “discrim”- yuxarı üçdə bir payla, aşağı üçdə bir payların fərqidir;
Altıncı sütunda, ” lower”- aşağı bal qrupunda cavabı seçənlərin payıdır;
Doqquzuncu sütunda, ” upper”- yuxarı bal qrupunda cavabı seçənlərin payıdır.
Cəm ballarının müxtəlif şkalalara çevrilməsi (score.transform)
Bu funksiya cəm ballarını yeni, parametrləri verilmiş şkalaya çevirir. Bu zaman yeni şkalanı xarakterizə edən, orta qiymət, standart yayınma və paylanmanın normallaşdırılması verilir.
data(CTTdata)
data(CTTkey)
scores <- score(CTTdata,CTTkey)$score
score.transform(scores,3,1)# Cəm ballarını orta qiyməti-3, standart yayınması 1 olan şkalaya çevirir.
## $new.scores
## P1 P2 P3 P4 P5 P6 P7 P8
## 1.124056 2.893815 1.345276 2.451375 3.778694 2.008935 1.787716 3.557474
## P9 P10 P11 P12 P13 P14 P15 P16
## 3.557474 2.451375 3.778694 1.787716 3.778694 3.557474 4.884792 2.008935
## P17 P18 P19 P20 P21 P22 P23 P24
## 2.008935 2.008935 2.672595 2.893815 3.557474 2.008935 2.230155 2.672595
## P25 P26 P27 P28 P29 P30 P31 P32
## 2.893815 2.008935 2.230155 2.672595 2.451375 2.008935 3.115034 2.230155
## P33 P34 P35 P36 P37 P38 P39 P40
## 2.008935 2.008935 2.451375 1.566496 3.336254 2.451375 2.451375 2.672595
## P41 P42 P43 P44 P45 P46 P47 P48
## 1.787716 2.451375 3.115034 2.451375 2.451375 2.451375 4.663573 4.663573
## P49 P50 P51 P52 P53 P54 P55 P56
## 4.221133 2.451375 2.672595 3.557474 3.557474 1.787716 2.008935 2.008935
## P57 P58 P59 P60 P61 P62 P63 P64
## 2.008935 3.999913 2.893815 2.451375 4.663573 2.230155 3.778694 4.221133
## P65 P66 P67 P68 P69 P70 P71 P72
## 1.787716 2.893815 1.566496 4.884792 5.327232 5.106012 3.115034 2.893815
## P73 P74 P75 P76 P77 P78 P79 P80
## 3.557474 3.115034 3.778694 2.893815 3.557474 3.557474 4.221133 4.221133
## P81 P82 P83 P84 P85 P86 P87 P88
## 3.999913 3.778694 2.451375 1.787716 2.008935 4.884792 3.115034 3.778694
## P89 P90 P91 P92 P93 P94 P95 P96
## 5.106012 4.221133 2.230155 2.230155 1.787716 3.778694 2.451375 3.557474
## P97 P98 P99 P100
## 4.221133 4.663573 3.115034 4.442353
##
## $p.scores
## P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16
## 0.01 0.53 0.02 0.37 0.77 0.18 0.08 0.68 0.68 0.37 0.77 0.08 0.77 0.68 0.96 0.18
## P17 P18 P19 P20 P21 P22 P23 P24 P25 P26 P27 P28 P29 P30 P31 P32
## 0.18 0.18 0.47 0.53 0.68 0.18 0.27 0.47 0.53 0.18 0.27 0.47 0.37 0.18 0.59 0.27
## P33 P34 P35 P36 P37 P38 P39 P40 P41 P42 P43 P44 P45 P46 P47 P48
## 0.18 0.18 0.37 0.03 0.63 0.37 0.37 0.47 0.08 0.37 0.59 0.37 0.37 0.37 0.92 0.92
## P49 P50 P51 P52 P53 P54 P55 P56 P57 P58 P59 P60 P61 P62 P63 P64
## 0.86 0.37 0.47 0.68 0.68 0.08 0.18 0.18 0.18 0.82 0.53 0.37 0.92 0.27 0.77 0.86
## P65 P66 P67 P68 P69 P70 P71 P72 P73 P74 P75 P76 P77 P78 P79 P80
## 0.08 0.53 0.03 0.96 1.00 0.98 0.59 0.53 0.68 0.59 0.77 0.53 0.68 0.68 0.86 0.86
## P81 P82 P83 P84 P85 P86 P87 P88 P89 P90 P91 P92 P93 P94 P95 P96
## 0.82 0.77 0.37 0.08 0.18 0.96 0.59 0.77 0.98 0.86 0.27 0.27 0.08 0.77 0.37 0.68
## P97 P98 P99 P100
## 0.86 0.92 0.59 0.90
score.transform(scores,3,1,TRUE)# Cəm balları normallaşdırılmış şkalaya keçirilir
## $new.scores
## P1 P2 P3 P4 P5 P6 P7 P8
## 0.6736521 3.0752699 0.9462511 2.6681467 3.7388468 2.0846349 1.5949284 3.4676988
## P9 P10 P11 P12 P13 P14 P15 P16
## 3.4676988 2.6681467 3.7388468 1.5949284 3.7388468 3.4676988 4.7506861 2.0846349
## P17 P18 P19 P20 P21 P22 P23 P24
## 2.0846349 2.0846349 2.9247301 3.0752699 3.4676988 2.0846349 2.3871870 2.9247301
## P25 P26 P27 P28 P29 P30 P31 P32
## 3.0752699 2.0846349 2.3871870 2.9247301 2.6681467 2.0846349 3.2275450 2.3871870
## P33 P34 P35 P36 P37 P38 P39 P40
## 2.0846349 2.0846349 2.6681467 1.1192064 3.3318533 2.6681467 2.6681467 2.9247301
## P41 P42 P43 P44 P45 P46 P47 P48
## 1.5949284 2.6681467 3.2275450 2.6681467 2.6681467 2.6681467 4.4050716 4.4050716
## P49 P50 P51 P52 P53 P54 P55 P56
## 4.0803193 2.6681467 2.9247301 3.4676988 3.4676988 1.5949284 2.0846349 2.0846349
## P57 P58 P59 P60 P61 P62 P63 P64
## 2.0846349 3.9153651 3.0752699 2.6681467 4.4050716 2.3871870 3.7388468 4.0803193
## P65 P66 P67 P68 P69 P70 P71 P72
## 1.5949284 3.0752699 1.1192064 4.7506861 Inf 5.0537489 3.2275450 3.0752699
## P73 P74 P75 P76 P77 P78 P79 P80
## 3.4676988 3.2275450 3.7388468 3.0752699 3.4676988 3.4676988 4.0803193 4.0803193
## P81 P82 P83 P84 P85 P86 P87 P88
## 3.9153651 3.7388468 2.6681467 1.5949284 2.0846349 4.7506861 3.2275450 3.7388468
## P89 P90 P91 P92 P93 P94 P95 P96
## 5.0537489 4.0803193 2.3871870 2.3871870 1.5949284 3.7388468 2.6681467 3.4676988
## P97 P98 P99 P100
## 4.0803193 4.4050716 3.2275450 4.2815516
##
## $p.scores
## P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16
## 0.01 0.53 0.02 0.37 0.77 0.18 0.08 0.68 0.68 0.37 0.77 0.08 0.77 0.68 0.96 0.18
## P17 P18 P19 P20 P21 P22 P23 P24 P25 P26 P27 P28 P29 P30 P31 P32
## 0.18 0.18 0.47 0.53 0.68 0.18 0.27 0.47 0.53 0.18 0.27 0.47 0.37 0.18 0.59 0.27
## P33 P34 P35 P36 P37 P38 P39 P40 P41 P42 P43 P44 P45 P46 P47 P48
## 0.18 0.18 0.37 0.03 0.63 0.37 0.37 0.47 0.08 0.37 0.59 0.37 0.37 0.37 0.92 0.92
## P49 P50 P51 P52 P53 P54 P55 P56 P57 P58 P59 P60 P61 P62 P63 P64
## 0.86 0.37 0.47 0.68 0.68 0.08 0.18 0.18 0.18 0.82 0.53 0.37 0.92 0.27 0.77 0.86
## P65 P66 P67 P68 P69 P70 P71 P72 P73 P74 P75 P76 P77 P78 P79 P80
## 0.08 0.53 0.03 0.96 1.00 0.98 0.59 0.53 0.68 0.59 0.77 0.53 0.68 0.68 0.86 0.86
## P81 P82 P83 P84 P85 P86 P87 P88 P89 P90 P91 P92 P93 P94 P95 P96
## 0.82 0.77 0.37 0.08 0.18 0.96 0.59 0.77 0.98 0.86 0.27 0.27 0.08 0.77 0.37 0.68
## P97 P98 P99 P100
## 0.86 0.92 0.59 0.90
Yuxarıda verilən I cədvəldə iştirakçıların yığdıqları cəm ballar orta qiyməti 3, standart meyli 1 olan şkalaya çevrilibdir. Belə ki P1 = 1.124056, birinci iştirakçının yeni şkalada balı, P2 = 2.893815, ikinci iştirakçının yeni şkalada balı və nəhayət, P100 = 4.442353 yüzüncü iştirakçının yeni şkalad balıdır.
İkinci cədvəldə iştirakçıların yeni şkaladakı balların prosentil ranqlarıdır.
Üçüncü cədvəldə İştirakçıların çəm balları əvvəlcə prosentil ranqlara çevrilir sonra normallaşdırılmış şkalaya gətirilir.
Dördüncü cədvəldə iştirakçıların yeni şkaladakı balların prosentil ranqlarıdır.
ShinyItemAnalysis paketini buradan ShinyItemAnalysis yükləyə bilərsiz. Tapşırıqların və testin hərtərəfli analizini bu paketlə aparmaq olur. Bu paket geniş imkanlara malikdır və tez-tez müəllifləri tərəfindən yenilənir.
Tapşırıqların ənənəvi analizi cədvəlində verilənlərin şərhi:
Diff. -tapşırığın çətinlik dərəcəsi;
Avg. score -tapşırığın orta qiyməti;
SD -Standart yayınma;
Min -Cəm balların minimumu;
Obs. min. -Müşahidə olunan cəm balların minimumu;
Max.-Cəm balların maksimumu;
Obs. max. -Müşahidə olunan cəm balların maksimumu;
Prop. max. -Maksimal balın payı;
RIT -Tapşırığa cavabla cəm ballar arasında Pirson korrelyasiyası;
RIR -Tapşırığa cavabla cəm ballar arasında Pirson korrelyasiyası(tapşırığa cavab cəm ballara daxıl edilmədikdə);
I-C cor. -Tapşırıqla xarici meyar arasında korrelyasiya;
ULI -Yuxarı-aşağı indeksi;
Rel -Tapşırığın etibarlılıq indeksi;
Val. -Tapşırığın validlik indeksi;
α-drop -Tapşırıq daxil edilmədikdə Kronbax alfası;
Missed [%] -Tapşırığa verilməyən cavabların faizi;
Not-reached [%] -Tapşırığa verilməyən və axırda gələn cavabların faizi.
# Datanın yüklənməsi
data(GMAT, package = "difNLR")
Data <- GMAT[, 1:20]
# Tapşırıqların analiz cədvəli
ItemAnalysis(Data)
## Difficulty Mean SD Cut.score obs.min Min.score obs.max
## Item1 0.5250 0.5250 0.4994995 NA 0 0 1
## Item2 0.5695 0.5695 0.4952700 NA 0 0 1
## Item3 0.7135 0.7135 0.4522389 NA 0 0 1
## Item4 0.7820 0.7820 0.4129907 NA 0 0 1
## Item5 0.8145 0.8145 0.3887999 NA 0 0 1
## Item6 0.6390 0.6390 0.4804107 NA 0 0 1
## Item7 0.6505 0.6505 0.4769313 NA 0 0 1
## Item8 0.6175 0.6175 0.4861192 NA 0 0 1
## Item9 0.5790 0.5790 0.4938430 NA 0 0 1
## Item10 0.5755 0.5755 0.4943905 NA 0 0 1
## Item11 0.6745 0.6745 0.4686785 NA 0 0 1
## Item12 0.5480 0.5480 0.4978151 NA 0 0 1
## Item13 0.7420 0.7420 0.4376434 NA 0 0 1
## Item14 0.4440 0.4440 0.4969784 NA 0 0 1
## Item15 0.5230 0.5230 0.4995956 NA 0 0 1
## Item16 0.4475 0.4475 0.4973605 NA 0 0 1
## Item17 0.4525 0.4525 0.4978631 NA 0 0 1
## Item18 0.4105 0.4105 0.4920476 NA 0 0 1
## Item19 0.4825 0.4825 0.4998186 NA 0 0 1
## Item20 0.4125 0.4125 0.4924073 NA 0 0 1
## Max.score Prop.max.score RIR RIT Corr.criterion ULI
## Item1 1 0.5250 0.2300015 0.3794852 NA 0.4265541
## Item2 1 0.5695 0.2176401 0.3668988 NA 0.4235245
## Item3 1 0.7135 0.1305271 0.2722884 NA 0.2910895
## Item4 1 0.7820 0.1158848 0.2460563 NA 0.2485954
## Item5 1 0.8145 0.2072500 0.3254967 NA 0.2930775
## Item6 1 0.6390 0.2224256 0.3669093 NA 0.4243808
## Item7 1 0.6505 0.1582553 0.3061394 NA 0.3169035
## Item8 1 0.6175 0.1567900 0.3075757 NA 0.3448708
## Item9 1 0.5790 0.1275355 0.2823581 NA 0.3001132
## Item10 1 0.5755 0.1298544 0.2847238 NA 0.3419413
## Item11 1 0.6745 0.2142462 0.3558820 NA 0.4079760
## Item12 1 0.5480 0.1510732 0.3057905 NA 0.3393674
## Item13 1 0.7420 0.1323092 0.2694556 NA 0.2788461
## Item14 1 0.4440 0.1968766 0.3482509 NA 0.3762431
## Item15 1 0.5230 0.1298921 0.2863724 NA 0.2931677
## Item16 1 0.4475 0.2575211 0.4039370 NA 0.4535999
## Item17 1 0.4525 0.1144621 0.2712005 NA 0.2891216
## Item18 1 0.4105 0.2588270 0.4035920 NA 0.4495038
## Item19 1 0.4825 0.2216356 0.3719132 NA 0.4068644
## Item20 1 0.4125 0.1684298 0.3204054 NA 0.3198580
## gULI Alpha.drop Index.rel Index.val Perc.miss Perc.nr
## Item1 NA 0.5301389 0.1895527 NA 0 0
## Item2 NA 0.5322994 0.1817140 NA 0 0
## Item3 NA 0.5461685 0.1231394 NA 0 0
## Item4 NA 0.5477961 0.1016190 NA 0 0
## Item5 NA 0.5357040 0.1265531 NA 0 0
## Item6 NA 0.5317089 0.1762671 NA 0 0
## Item7 NA 0.5421032 0.1460075 NA 0 0
## Item8 NA 0.5424031 0.1495184 NA 0 0
## Item9 NA 0.5472787 0.1394406 NA 0 0
## Item10 NA 0.5469089 0.1407647 NA 0 0
## Item11 NA 0.5332081 0.1667943 NA 0 0
## Item12 NA 0.5434557 0.1522271 NA 0 0
## Item13 NA 0.5457481 0.1179255 NA 0 0
## Item14 NA 0.5357878 0.1730732 NA 0 0
## Item15 NA 0.5469986 0.1430704 NA 0 0
## Item16 NA 0.5254645 0.2009023 NA 0 0
## Item17 NA 0.5495082 0.1350207 NA 0 0
## Item18 NA 0.5253825 0.1985865 NA 0 0
## Item19 NA 0.5315644 0.1858892 NA 0 0
## Item20 NA 0.5405342 0.1577699 NA 0 0
Bu paketdən istifadə edərək, eyni bir testin tapşırıqlarının çətinlik dərəcələrini və ayrıdetmə əmsallarını yan-yana verən DDplot təqdiminə baxaq
Asan testin tapşırıqlarının çətinlik dərəcələrini və ayrıdetmə əmsallarını yan-yana verən DDplot təqdimi
# Çətinliik dərəcəsi və ayridetmə diaqramı
DDplot(Asan, discrim = 'ULI', k = 3, l = 1, u = 3)
Orta testin tapşırıqlarının çətinlik dərəcələrini və ayrıdetmə əmsallarını yan-yana verən DDplot təqdimi
DDplot(Orta, discrim = 'ULI', k = 3, l = 1, u = 3)
Çətin testin tapşırıqlarının çətinlik dərəcələrini və ayrıdetmə əmsallarını yan-yana verən DDplot təqdimi
DDplot(Çətin, discrim = 'ULI', k = 3, l = 1, u = 3)
psych -paketindən alpha -funksiyasından istifadə edərək, hər üç səviyyəli testlərin Kronbax alfasını tapa bilərik.
Tapşırıqlara cavabların xarakterik əyriləri
İstifadə olunan datanı (GMATtest) və onun açarını (GMATkey) buradan GMATtest yükləyə bilərsiz.
Datanın və onun açarının yüklənməsi
library(ShinyItemAnalysis)
data(GMATtest, GMATkey, package = "difNLR")
Data <- GMATtest[, 1:20]
key <- GMATkey
Tapşırıq 1 və 3-də 5 grup üzrə doğru cavabın və distraktorların xarakterik əyriləri
plotDistractorAnalysis(Data, key, num.group = 5, item = c(1, 3), multiple.answers = TRUE)
## $Item1
##
## $Item3
Tapşırıq 1 və 3-də 3 grup üzrə doğru cavabın və distraktorların xarakterik əyriləri
plotDistractorAnalysis(Data, key, num.group = 3, item = c(1, 3), multiple.answers = FALSE)
## $Item1
##
## $Item3
Tapşırıq 1 və 3-də 5 grup üzrə doğru cavabı və distraktorları seçənlərin sayı
# table with counts - item 1 and 3 groups
DistractorAnalysis(Data, key, item = c(1, 3), num.groups = 5)
## $Item1
## score.level
## response Group1 Group2 Group3 Group4 Group5
## A 144 200 291 141 274
## B 155 124 88 28 33
## C 139 100 84 22 20
## D 60 38 41 9 9
##
## $Item3
## score.level
## response Group1 Group2 Group3 Group4 Group5
## A 263 331 381 162 290
## B 89 55 56 16 23
## C 49 27 29 4 6
## D 97 49 38 18 17
Tapşırıq 1 və 3-də 5 grup üzrə doğru cavabı və distraktorları seçənlərin faizi
DistractorAnalysis(Data, key, item = c(1, 3), num.groups = 5, p.table = TRUE)
## $Item1
## score.level
## response Group1 Group2 Group3 Group4 Group5
## A 0.28915663 0.43290043 0.57738095 0.70500000 0.81547619
## B 0.31124498 0.26839827 0.17460317 0.14000000 0.09821429
## C 0.27911647 0.21645022 0.16666667 0.11000000 0.05952381
## D 0.12048193 0.08225108 0.08134921 0.04500000 0.02678571
##
## $Item3
## score.level
## response Group1 Group2 Group3 Group4 Group5
## A 0.52811245 0.71645022 0.75595238 0.81000000 0.86309524
## B 0.17871486 0.11904762 0.11111111 0.08000000 0.06845238
## C 0.09839357 0.05844156 0.05753968 0.02000000 0.01785714
## D 0.19477912 0.10606061 0.07539683 0.09000000 0.05059524
Biz, indiyənə qədər testin və tapşırıqların analizində müxtəlif paketlərdən istifadə edirdik. Orada istifadə olunan datalar və konkret funksiyalar paketlərin içərisində idilər. İndi isə aşkar formada yazılmış funksiyalardan istifadə etmək istəyirik. Biz Klassik Test Nəzəriyyəsi çərçivəsində Salvador Castronun bu mənbədə Psychometrics yerləşdirdiyi funksiyalardan istifadə edəcəyik.
Lazım olan funksiyaların yüklənməsi
library(CTT)
library(psych)
library(entropy)
library(knitr)
library(DT)
Biz yuxarıda dataların verilməsinin 2 üsuluna baxmışdıq. Onlardan birində data bu və ya digər paketin içində olurdu və biz paketi yükləyəndə data da yüklənirdi. Digər halda, datanı özümüz süni sürətdə törədib işlək papkamızda saxlamışdıq və ona ehtiyac olanda R-yükləyirdik. Üçüncü çox geniş yayılmış bir üsul da datanı birbaşa internet səhifəsindən yükləməkdir. Aşağıda datanı və onun açarını internet səhifəsindən yükləyən kod çəngəsi verilmişdir. Bu data və onun açarı internet saytından kompüterə yükləndikdən sonra write.csv funksiyası ilə işlək papkaya yazılır və saxlanılır.
score <- read.csv("http://lang-tech.net/doc/sample.score.csv", header = TRUE, sep = ",")
write.csv("score","score.csv",row.names = FALSE)
## Cavab açarı
key <- read.csv("http://lang-tech.net/doc/sample.key.csv", header = TRUE, sep =",")
key <- as.matrix(key)
write.csv("key","key.csv",row.names = FALSE)
Aşağıdakı kod çəngəsilə yüklənən və işlək papkaya yazılan “score” datası, yüklənən və işlək papkaya yazılan “key”- açarı ilə kodlaşdırılır və ballaşdırılmış “myScore”-datasını alırıq. “str(myScore)”-komandası ballaşmış “myScore”-datasının qruluşuna göstərir.
myScore <- score(score, key, output.scored=TRUE)
myScore <- as.data.frame(myScore)
str(myScore)
## 'data.frame': 241 obs. of 21 variables:
## $ score : num 9 6 13 9 14 12 7 9 8 11 ...
## $ scored.1 : num 1 0 1 1 1 1 0 0 1 0 ...
## $ scored.2 : num 1 1 1 1 1 1 0 1 1 1 ...
## $ scored.3 : num 0 0 0 0 0 0 1 0 0 0 ...
## $ scored.4 : num 1 1 1 1 1 1 1 0 0 0 ...
## $ scored.5 : num 0 0 1 1 0 0 0 1 0 0 ...
## $ scored.6 : num 1 0 0 0 1 1 0 1 1 1 ...
## $ scored.7 : num 0 1 1 1 0 0 0 0 1 0 ...
## $ scored.8 : num 0 0 1 0 0 1 1 1 1 0 ...
## $ scored.9 : num 1 1 1 1 1 1 1 1 1 1 ...
## $ scored.10: num 0 1 1 1 0 0 0 1 0 0 ...
## $ scored.11: num 0 0 1 0 1 1 1 0 0 1 ...
## $ scored.12: num 0 0 1 0 1 0 0 1 1 1 ...
## $ scored.13: num 1 1 1 0 1 1 0 0 0 0 ...
## $ scored.14: num 0 0 1 0 1 1 0 0 1 0 ...
## $ scored.15: num 0 0 1 1 1 1 0 0 0 1 ...
## $ scored.16: num 1 0 0 0 1 1 1 0 0 1 ...
## $ scored.17: num 1 0 0 0 1 1 0 0 0 1 ...
## $ scored.18: num 1 0 0 0 1 0 0 1 0 1 ...
## $ scored.19: num 0 0 0 0 0 0 0 1 0 1 ...
## $ scored.20: num 0 0 0 1 1 0 1 0 0 1 ...
Bu mənbədən birinci baxacağımız aşağıdakı funksiya tapşırıqların analizi adlanır. Funksiya gövdəsində yuxarıda baxdığımız “CTT” paketindən istifadə edir. Funksiyanın kodu “dump” komandası ilə işlək papkaya yazılır. Yekun tapşırıqların analizi cədvəlində ayrıdetmə əmsalları 0.2-dən kiçik olanlar, orta qiymətləri 0.15-dən kiçik və ya 0.85-dən böyük olan tapşırıqlar işarələnir.
responses <- myScores
item.analysis <-
function(responses){
# CRITICAL VALUES
cvpb = 0.20
cvdl = 0.15
cvdu = 0.85
require(CTT, warn.conflicts = FALSE, quietly = TRUE)
(ctt.analysis <- CTT::reliability(responses, itemal = TRUE, NA.Delete = TRUE))
# Mark items that are potentially problematic
item.analysis <- data.frame(item = seq(1:ctt.analysis$nItem),
r.pbis = ctt.analysis$pBis,
bis = ctt.analysis$bis,
item.mean = ctt.analysis$itemMean,
alpha.del = ctt.analysis$alphaIfDeleted)
# code provided by Dr. Gordon Brooks
if (TRUE) {
item.analysis$check <-
ifelse(item.analysis$r.pbis < cvpb |
item.analysis$item.mean < cvdl |
item.analysis$item.mean > cvdu, "‡", "")
}
return(item.analysis)
}
dump("item.analysis", file = "item.analysis.R")
knitr::kable(item.analysis(myScore),
align = "c",
caption = "Item Analysis")
| item | r.pbis | bis | item.mean | alpha.del | check | |
|---|---|---|---|---|---|---|
| score | 1 | 1.0000000 | 1.0087979 | 9.4398340 | 0.5395239 | ‡ |
| scored.1 | 2 | 0.1860210 | 0.2737047 | 0.7593361 | 0.6541133 | ‡ |
| scored.2 | 3 | 0.1773739 | 0.2420260 | 0.7344398 | 0.6545049 | ‡ |
| scored.3 | 4 | 0.1241358 | 0.1679061 | 0.2572614 | 0.6576259 | ‡ |
| scored.4 | 5 | 0.1375860 | 0.1839489 | 0.6804979 | 0.6568143 | ‡ |
| scored.5 | 6 | 0.1916437 | 0.2420060 | 0.3651452 | 0.6533440 | ‡ |
| scored.6 | 7 | 0.4395083 | 0.5566908 | 0.5394191 | 0.6363511 | |
| scored.7 | 8 | 0.1453049 | 0.1912416 | 0.2780083 | 0.6563727 | ‡ |
| scored.8 | 9 | 0.1948749 | 0.2438010 | 0.4813278 | 0.6530025 | ‡ |
| scored.9 | 10 | 0.2135278 | 0.3144025 | 0.8298755 | 0.6532307 | |
| scored.10 | 11 | 0.0399229 | 0.0502750 | 0.4356846 | 0.6631850 | ‡ |
| scored.11 | 12 | 0.2475007 | 0.3136740 | 0.3360996 | 0.6498682 | |
| scored.12 | 13 | 0.2107526 | 0.2683077 | 0.5601660 | 0.6519692 | |
| scored.13 | 14 | 0.3098228 | 0.3930337 | 0.3900415 | 0.6455139 | |
| scored.14 | 15 | 0.2942469 | 0.3645838 | 0.4481328 | 0.6463482 | |
| scored.15 | 16 | 0.2702984 | 0.3524129 | 0.3112033 | 0.6485876 | |
| scored.16 | 17 | 0.4081455 | 0.5385081 | 0.6390041 | 0.6392033 | |
| scored.17 | 18 | 0.5278909 | 0.6618834 | 0.4356846 | 0.6303082 | |
| scored.18 | 19 | 0.4688541 | 0.5905515 | 0.3319502 | 0.6355863 | |
| scored.19 | 20 | 0.1612577 | 0.2224488 | 0.1908714 | 0.6557272 | ‡ |
| scored.20 | 21 | 0.1885263 | 0.2367608 | 0.4356846 | 0.6534506 | ‡ |
Ikinci baxacağımız funksiya tapşırığın çətinlik dərəcəsini hesablayır və tapşırıqları çətinliklərinə görə müəyyən məqbul zolağı verməklə təqdim edir.
item.difficulty <-
function(responses){
# CRITICAL VALUES
cvpb = 0.20
cvdl = 0.15
cvdu = 0.85
require(CTT, warn.conflicts = FALSE, quietly = TRUE)
ctt.analysis <- CTT::reliability(responses, itemal = TRUE, NA.Delete = TRUE)
test_difficulty <- data.frame(item = 1:ctt.analysis$nItem ,
difficulty = ctt.analysis$itemMean)
plot(test_difficulty,
main = "Test Item Difficulty",
type = "p",
pch = 1,
cex = 2.8,
col = "purple",
ylab = "Item Mean (Difficulty)",
xlab = "Item Number",
ylim = c(0, 1),
xlim = c(0, ctt.analysis$nItem))
abline(h = cvdl, col = "tomato")
abline(h = cvdu, col = "tomato")
abline(h = .3, col = "dodgerblue")
abline(h = .7, col = "dodgerblue")
text(diff(range(test_difficulty[, 1]))/2, 0.7,
"maximum information range",
col = "dodger blue",
pos = 3)
text(diff(range(test_difficulty[, 1]))/2, cvdu,
"rule of thumb acceptable range",
col = "tomato",
pos = 3)
outlier <- data.matrix(subset(cbind(test_difficulty[, 1], test_difficulty[, 2]),
subset = (test_difficulty[, 2] < cvdl |
test_difficulty[, 2] > cvdu)))
text(outlier, paste("i", outlier[,1], sep = ""), col = "red", cex = .7)
outlier2 <- data.matrix(subset(cbind(test_difficulty[, 1],
test_difficulty[, 2]),
subset = ((test_difficulty[, 2] > cvdl &
test_difficulty[, 2] < .3) |
(test_difficulty[, 2] < cvdu &
test_difficulty[, 2] > .7))))
text(outlier2, paste("i", outlier2[,1], sep = ""),
col = "dodgerblue",
cex = .7)
return(test_difficulty[order(test_difficulty$difficulty),])
}
dump("item.difficulty", file = "item.difficulty.R")
item.difficulty(myScore)
## item difficulty
## scored.19 20 0.1908714
## scored.3 4 0.2572614
## scored.7 8 0.2780083
## scored.15 16 0.3112033
## scored.18 19 0.3319502
## scored.11 12 0.3360996
## scored.5 6 0.3651452
## scored.13 14 0.3900415
## scored.10 11 0.4356846
## scored.17 18 0.4356846
## scored.20 21 0.4356846
## scored.14 15 0.4481328
## scored.8 9 0.4813278
## scored.6 7 0.5394191
## scored.12 13 0.5601660
## scored.16 17 0.6390041
## scored.4 5 0.6804979
## scored.2 3 0.7344398
## scored.1 2 0.7593361
## scored.9 10 0.8298755
## score 1 9.4398340
Üçüncü baxacağımız funksiya tapşırığın ayrıdetməsini hesablayır və tapşırıqları ayrıdetmələrinə görə müəyyən məqbul sərhəddi verməklə təqdim edir.
item.discrimination <-
function(responses){
# CRITICAL VALUES
cvpb = 0.20
cvdl = 0.15
cvdu = 0.85
require(CTT, warn.conflicts = FALSE, quietly = TRUE)
ctt.analysis <- CTT::reliability(responses, itemal = TRUE, NA.Delete = TRUE)
item.discrimination <- data.frame(item = 1:ctt.analysis$nItem ,
discrimination = ctt.analysis$pBis)
plot(item.discrimination,
type = "p",
pch = 1,
cex = 3,
col = "purple",
ylab = "Item-Total Correlation",
xlab = "Item Number",
ylim = c(0, 1),
main = "Test Item Discriminations")
abline(h = cvpb, col = "red")
outlier <- data.matrix(subset(item.discrimination,
subset = (item.discrimination[, 2] < cvpb)))
text(outlier, paste("i", outlier[,1], sep = ""), col = "red", cex = .7)
return(item.discrimination[order(item.discrimination$discrimination),])
}
dump("item.discrimination", file = "item.discrimination.R")
item.discrimination(myScore)
## item discrimination
## 11 11 0.03992288
## 4 4 0.12413582
## 5 5 0.13758603
## 8 8 0.14530492
## 20 20 0.16125767
## 3 3 0.17737395
## 2 2 0.18602103
## 21 21 0.18852627
## 6 6 0.19164371
## 9 9 0.19487493
## 13 13 0.21075259
## 10 10 0.21352775
## 12 12 0.24750066
## 16 16 0.27029840
## 15 15 0.29424690
## 14 14 0.30982277
## 17 17 0.40814549
## 7 7 0.43950835
## 19 19 0.46885413
## 18 18 0.52789093
## 1 1 1.00000000
responses <- myScore
cronbachs.alpha <-
function(X){
X <- data.matrix(X)
n <- ncol(X) # Number of items
k <- nrow(X) # Number of examinees
# Cronbachs alpha
alpha <- (n/(n - 1))*(1 - sum(apply(X, 2, var))/var(rowSums(X)))
return(list("Crombach's alpha" = alpha,
"Number of items" = n,
"Number of examinees" = k))
}
dump("cronbachs.alpha", file = "cronbachs.alpha.R")
# compute cronbachs alpha
cronbachs.alpha(responses)
## $`Crombach's alpha`
## [1] 0.6595438
##
## $`Number of items`
## [1] 21
##
## $`Number of examinees`
## [1] 241
Funksiya Kronbax alfasını, tapşırıqların sayını və iştirakçıların sayını verir. dump funksiyanı işlək papkaya yazır.
Kronbax alfası üçün aldığımız nəticəni yuxarıda CTT-paketi vasitəsilə aldığımız nəticə ilə tutuşdura bilərik
# müqayisə
CTT::reliability(responses)
##
## Number of Items
## 21
##
## Number of Examinees
## 241
##
## Coefficient Alpha
## 0.66
# formula 20
KR20 <-
function(X){
X <- data.matrix(X)
k <- ncol(X)
# Person total score variances
SX <- var(rowSums(X))
# item means
IM <- colMeans(X)
return(((k/(k - 1))*((SX - sum(IM*(1 - IM)))/SX)))
}
dump("KR20", file = "KR20.R")
KR20(responses)
## [1] 3.24482
# Kuder-Richardson formula 21
KR21 <-
function(X){
X <- data.matrix(X)
n <- ncol(X)
return((n/(n-1))*((var(rowSums(X)) - n*(sum(colMeans(X))/n) *
(1-(sum(colMeans(X))/n))))/var(rowSums(X)))
}
dump("KR21", file = "KR21.R")
KR21(responses)
## [1] 0.9944366
# Spearman-Brown formula
SpearmanBrown <-
function(x, n1, n2){
source("cronbachs.alpha.R")
x <- as.matrix(x)
N <- n2/n1
# cronbach's alpha for the original test
alpha <- cronbachs.alpha(x)[[1]]
predicted.alpha <- N * alpha / (1 + (N - 1) * alpha)
return(list(original.reliability = alpha,
original.sample.size = n1,
predicted.reliability = predicted.alpha,
predicted.sample.size = n2))
}
dump("SpearmanBrown", file = "SpearmanBrown.R")
# predict reliability by Spearman-Brown formula
# if the number of items is reduced from 25 to 15
SpearmanBrown(responses, n1 = 25, n2 = 15)
## $original.reliability
## [1] 0.6595438
##
## $original.sample.size
## [1] 25
##
## $predicted.reliability
## [1] 0.5375383
##
## $predicted.sample.size
## [1] 15
Tapşırıqların sayı 25-dən 35-ə qədər artırıldıqda Spirman-Broun düsturu
SpearmanBrown(responses, n1 = 25, n2 = 35)
## $original.reliability
## [1] 0.6595438
##
## $original.sample.size
## [1] 25
##
## $predicted.reliability
## [1] 0.7306128
##
## $predicted.sample.size
## [1] 35
Ölçmənin standart səhvi (Standard Error of Measurement)
SEM <-
function(X){
source("cronbachs.alpha.R")
X <- data.matrix(X)
return(sd(rowSums(X)) * sqrt(1 - cronbachs.alpha(X)[[1]]))
}
SEM(responses)
## [1] 3.502034
# 90% confidence interval for the true score
head(cbind(lower_bound = round(rowSums(responses)-1.65* sd(rowSums(responses))*
sqrt(1-KR20(responses)), 2), observed = rowSums(responses),
upper_bound = round(rowSums(responses)+1.65* sd(rowSums(responses))*
sqrt(1-KR20(responses)), 2)), 20)
## Warning in sqrt(1 - KR20(responses)): NaNs produced
## Warning in sqrt(1 - KR20(responses)): NaNs produced
## lower_bound observed upper_bound
## P1 NaN 18 NaN
## P2 NaN 12 NaN
## P3 NaN 26 NaN
## P4 NaN 18 NaN
## P5 NaN 28 NaN
## P6 NaN 24 NaN
## P7 NaN 14 NaN
## P8 NaN 18 NaN
## P9 NaN 16 NaN
## P10 NaN 22 NaN
## P11 NaN 12 NaN
## P12 NaN 16 NaN
## P13 NaN 10 NaN
## P14 NaN 26 NaN
## P15 NaN 16 NaN
## P16 NaN 10 NaN
## P17 NaN 30 NaN
## P18 NaN 16 NaN
## P19 NaN 20 NaN
## P20 NaN 26 NaN
library("epmr")
library("ggplot2")
library(irtoys)
library(psych)
library(lsasim)
Test nəticələrinin analizini aparmaq, müxtəlif səviyyəli testlərin nəticələrinin müqayisəli təhlilinə baxmaq üçün bizdə müxtəlif səviyyəli testlərin nəticələri olmalıdır. Bu məqsədlə biz, müxtəlif səviyyəli testlərin nəticələrini törədirik. Müxtəlif səviyyəli testlərin törədilməsi, tapşırıqların çətinlik dərəcələrinin müxtəlif səviyyələrdə seçilməsi ilə nail olunur.
Aşağıdakı kod çəngində biz 3 parametrli Birnbaum modelindən istifadə edərək Asan səviyyəli test törətmişik. Testin asanlığına sualların çətinlik dərəcəsinin (-2;0)-logit intervalında dəyişməsilə nail olunur. Biz Müasir Test Nəzəriyyəsi (İtem Respons Theory) ilə tanış olmadığımızdan bu kodların şərhini vermirik.
Asan_3PL <- lsasim::item_gen(n_3pl = 40, b_bounds = c(-2, 0),
a_bounds = c(.75, 1.25), c_bounds = c(0, .25))
Asan_3PL_Tapş <- as.matrix(cbind(alpha = Asan_3PL$a,
delta = Asan_3PL$b,
chi = Asan_3PL$c))
set.seed(1954)
Asan_data_3PL <- irtoys::sim(ip = Asan_3PL_Tapş, x = rnorm(1000,0,1))
colnames(Asan_data_3PL) <- paste0("Tapsh", "-",1:40)
rownames(Asan_data_3PL) <- paste0("Ish", "-",1:1000)
head(Asan_data_3PL,4)
## Tapsh-1 Tapsh-2 Tapsh-3 Tapsh-4 Tapsh-5 Tapsh-6 Tapsh-7 Tapsh-8 Tapsh-9
## Ish-1 1 1 1 1 1 1 0 1 1
## Ish-2 1 1 1 1 1 1 1 0 1
## Ish-3 1 1 1 1 1 0 1 0 1
## Ish-4 1 1 1 0 1 1 1 1 1
## Tapsh-10 Tapsh-11 Tapsh-12 Tapsh-13 Tapsh-14 Tapsh-15 Tapsh-16 Tapsh-17
## Ish-1 1 0 1 0 1 1 1 1
## Ish-2 0 1 1 0 1 1 1 1
## Ish-3 1 1 1 0 0 1 1 1
## Ish-4 1 1 1 1 1 0 1 1
## Tapsh-18 Tapsh-19 Tapsh-20 Tapsh-21 Tapsh-22 Tapsh-23 Tapsh-24 Tapsh-25
## Ish-1 1 1 1 1 1 0 1 1
## Ish-2 0 1 1 1 0 0 1 1
## Ish-3 1 1 1 1 1 1 1 1
## Ish-4 1 1 1 0 1 1 1 1
## Tapsh-26 Tapsh-27 Tapsh-28 Tapsh-29 Tapsh-30 Tapsh-31 Tapsh-32 Tapsh-33
## Ish-1 1 0 1 1 1 0 0 1
## Ish-2 1 1 0 1 1 1 1 1
## Ish-3 1 1 1 1 1 0 1 0
## Ish-4 1 1 1 1 1 1 1 1
## Tapsh-34 Tapsh-35 Tapsh-36 Tapsh-37 Tapsh-38 Tapsh-39 Tapsh-40
## Ish-1 0 0 1 0 1 1 1
## Ish-2 1 0 1 0 1 1 1
## Ish-3 1 1 1 1 1 0 1
## Ish-4 1 1 1 0 1 1 1
describe(Asan_data_3PL)
## vars n mean sd median trimmed mad min max range skew kurtosis
## Tapsh-1 1 1000 0.81 0.39 1 0.89 0 0 1 1 -1.60 0.57
## Tapsh-2 2 1000 0.80 0.40 1 0.88 0 0 1 1 -1.51 0.27
## Tapsh-3 3 1000 0.81 0.39 1 0.89 0 0 1 1 -1.61 0.60
## Tapsh-4 4 1000 0.82 0.39 1 0.90 0 0 1 1 -1.64 0.68
## Tapsh-5 5 1000 0.72 0.45 1 0.77 0 0 1 1 -0.95 -1.10
## Tapsh-6 6 1000 0.66 0.47 1 0.70 0 0 1 1 -0.67 -1.56
## Tapsh-7 7 1000 0.60 0.49 1 0.62 0 0 1 1 -0.39 -1.85
## Tapsh-8 8 1000 0.64 0.48 1 0.67 0 0 1 1 -0.57 -1.67
## Tapsh-9 9 1000 0.82 0.38 1 0.90 0 0 1 1 -1.69 0.86
## Tapsh-10 10 1000 0.58 0.49 1 0.60 0 0 1 1 -0.31 -1.91
## Tapsh-11 11 1000 0.64 0.48 1 0.67 0 0 1 1 -0.58 -1.67
## Tapsh-12 12 1000 0.70 0.46 1 0.75 0 0 1 1 -0.87 -1.24
## Tapsh-13 13 1000 0.69 0.46 1 0.73 0 0 1 1 -0.81 -1.35
## Tapsh-14 14 1000 0.76 0.43 1 0.83 0 0 1 1 -1.24 -0.48
## Tapsh-15 15 1000 0.77 0.42 1 0.83 0 0 1 1 -1.26 -0.41
## Tapsh-16 16 1000 0.67 0.47 1 0.71 0 0 1 1 -0.71 -1.50
## Tapsh-17 17 1000 0.83 0.38 1 0.91 0 0 1 1 -1.75 1.08
## Tapsh-18 18 1000 0.59 0.49 1 0.62 0 0 1 1 -0.38 -1.86
## Tapsh-19 19 1000 0.86 0.35 1 0.94 0 0 1 1 -2.01 2.06
## Tapsh-20 20 1000 0.71 0.45 1 0.77 0 0 1 1 -0.94 -1.12
## Tapsh-21 21 1000 0.80 0.40 1 0.87 0 0 1 1 -1.49 0.22
## Tapsh-22 22 1000 0.70 0.46 1 0.74 0 0 1 1 -0.85 -1.28
## Tapsh-23 23 1000 0.74 0.44 1 0.80 0 0 1 1 -1.08 -0.85
## Tapsh-24 24 1000 0.72 0.45 1 0.78 0 0 1 1 -1.00 -1.00
## Tapsh-25 25 1000 0.88 0.33 1 0.97 0 0 1 1 -2.32 3.39
## Tapsh-26 26 1000 0.67 0.47 1 0.72 0 0 1 1 -0.74 -1.45
## Tapsh-27 27 1000 0.77 0.42 1 0.84 0 0 1 1 -1.29 -0.32
## Tapsh-28 28 1000 0.63 0.48 1 0.66 0 0 1 1 -0.54 -1.71
## Tapsh-29 29 1000 0.76 0.42 1 0.83 0 0 1 1 -1.24 -0.46
## Tapsh-30 30 1000 0.79 0.41 1 0.86 0 0 1 1 -1.40 -0.04
## Tapsh-31 31 1000 0.80 0.40 1 0.88 0 0 1 1 -1.50 0.24
## Tapsh-32 32 1000 0.78 0.41 1 0.86 0 0 1 1 -1.38 -0.10
## Tapsh-33 33 1000 0.76 0.43 1 0.82 0 0 1 1 -1.20 -0.55
## Tapsh-34 34 1000 0.70 0.46 1 0.74 0 0 1 1 -0.85 -1.28
## Tapsh-35 35 1000 0.65 0.48 1 0.69 0 0 1 1 -0.64 -1.59
## Tapsh-36 36 1000 0.62 0.49 1 0.64 0 0 1 1 -0.47 -1.78
## Tapsh-37 37 1000 0.58 0.49 1 0.60 0 0 1 1 -0.31 -1.91
## Tapsh-38 38 1000 0.86 0.34 1 0.96 0 0 1 1 -2.13 2.55
## Tapsh-39 39 1000 0.62 0.49 1 0.65 0 0 1 1 -0.50 -1.75
## Tapsh-40 40 1000 0.89 0.31 1 0.99 0 0 1 1 -2.49 4.20
## se
## Tapsh-1 0.01
## Tapsh-2 0.01
## Tapsh-3 0.01
## Tapsh-4 0.01
## Tapsh-5 0.01
## Tapsh-6 0.02
## Tapsh-7 0.02
## Tapsh-8 0.02
## Tapsh-9 0.01
## Tapsh-10 0.02
## Tapsh-11 0.02
## Tapsh-12 0.01
## Tapsh-13 0.01
## Tapsh-14 0.01
## Tapsh-15 0.01
## Tapsh-16 0.01
## Tapsh-17 0.01
## Tapsh-18 0.02
## Tapsh-19 0.01
## Tapsh-20 0.01
## Tapsh-21 0.01
## Tapsh-22 0.01
## Tapsh-23 0.01
## Tapsh-24 0.01
## Tapsh-25 0.01
## Tapsh-26 0.01
## Tapsh-27 0.01
## Tapsh-28 0.02
## Tapsh-29 0.01
## Tapsh-30 0.01
## Tapsh-31 0.01
## Tapsh-32 0.01
## Tapsh-33 0.01
## Tapsh-34 0.01
## Tapsh-35 0.02
## Tapsh-36 0.02
## Tapsh-37 0.02
## Tapsh-38 0.01
## Tapsh-39 0.02
## Tapsh-40 0.01
## write.csv(Asan_data_3PL, file = "Asan.csv", row.names = FALSE)
Asan səviyyəli testin cəm ballarının paylanması.
Asan_Bal <- rowSums(Asan_data_3PL)
escores <- rnorm(length(Asan_Bal), 0, 1.4)
tscores <- setrange(Asan_Bal - escores, y = Asan_Bal)
Asan_scores <- data.frame(x1 = Asan_Bal, t = tscores,
e = escores)
P_asan <- ggplot(Asan_scores, aes(Asan_Bal, t)) +
geom_point(position = position_jitter(w = .3)) +
geom_abline(col = "blue",lwd =2)
P_asan
Orta_3PL <- lsasim::item_gen(n_3pl = 40, b_bounds = c(-1, 1),
a_bounds = c(.75, 1.25), c_bounds = c(0, .25))
Orta_3PL_Tapş <- as.matrix(cbind(alpha = Orta_3PL$a,
delta = Orta_3PL$b,
chi = Orta_3PL$c))
set.seed(1954)
Orta_data_3PL <- irtoys::sim(ip = Orta_3PL_Tapş, x = rnorm(1000,0,1))
colnames(Orta_data_3PL) <- paste0("Tapsh", "-",1:40)
rownames(Orta_data_3PL) <- paste0("Ish", "-",1:1000)
head(Orta_data_3PL,4)
## Tapsh-1 Tapsh-2 Tapsh-3 Tapsh-4 Tapsh-5 Tapsh-6 Tapsh-7 Tapsh-8 Tapsh-9
## Ish-1 1 0 0 1 1 1 1 1 1
## Ish-2 1 0 0 1 1 1 1 0 1
## Ish-3 1 1 1 0 1 1 1 0 1
## Ish-4 1 0 1 0 1 1 1 1 1
## Tapsh-10 Tapsh-11 Tapsh-12 Tapsh-13 Tapsh-14 Tapsh-15 Tapsh-16 Tapsh-17
## Ish-1 1 0 1 0 1 1 1 1
## Ish-2 0 1 0 0 1 0 1 0
## Ish-3 1 1 0 0 0 1 0 1
## Ish-4 1 1 1 0 1 0 1 0
## Tapsh-18 Tapsh-19 Tapsh-20 Tapsh-21 Tapsh-22 Tapsh-23 Tapsh-24 Tapsh-25
## Ish-1 0 0 1 0 1 0 1 1
## Ish-2 0 0 0 0 0 0 0 0
## Ish-3 0 1 1 1 1 1 0 0
## Ish-4 0 1 1 0 1 1 1 1
## Tapsh-26 Tapsh-27 Tapsh-28 Tapsh-29 Tapsh-30 Tapsh-31 Tapsh-32 Tapsh-33
## Ish-1 1 0 0 1 1 0 0 1
## Ish-2 1 1 0 1 1 0 0 1
## Ish-3 1 1 0 1 0 0 1 0
## Ish-4 1 1 1 1 1 0 1 1
## Tapsh-34 Tapsh-35 Tapsh-36 Tapsh-37 Tapsh-38 Tapsh-39 Tapsh-40
## Ish-1 0 0 1 0 1 1 0
## Ish-2 1 0 1 0 1 1 0
## Ish-3 1 1 1 1 0 0 1
## Ish-4 1 1 1 0 1 0 1
describe(Orta_data_3PL)
## vars n mean sd median trimmed mad min max range skew kurtosis
## Tapsh-1 1 1000 0.71 0.45 1 0.77 0 0 1 1 -0.94 -1.12
## Tapsh-2 2 1000 0.40 0.49 0 0.38 0 0 1 1 0.39 -1.85
## Tapsh-3 3 1000 0.49 0.50 0 0.49 0 0 1 1 0.04 -2.00
## Tapsh-4 4 1000 0.64 0.48 1 0.67 0 0 1 1 -0.57 -1.67
## Tapsh-5 5 1000 0.61 0.49 1 0.64 0 0 1 1 -0.45 -1.80
## Tapsh-6 6 1000 0.73 0.45 1 0.78 0 0 1 1 -1.02 -0.95
## Tapsh-7 7 1000 0.68 0.47 1 0.72 0 0 1 1 -0.77 -1.41
## Tapsh-8 8 1000 0.69 0.46 1 0.73 0 0 1 1 -0.81 -1.35
## Tapsh-9 9 1000 0.57 0.50 1 0.59 0 0 1 1 -0.28 -1.92
## Tapsh-10 10 1000 0.67 0.47 1 0.71 0 0 1 1 -0.71 -1.49
## Tapsh-11 11 1000 0.72 0.45 1 0.78 0 0 1 1 -0.98 -1.04
## Tapsh-12 12 1000 0.50 0.50 0 0.50 0 0 1 1 0.01 -2.00
## Tapsh-13 13 1000 0.45 0.50 0 0.43 0 0 1 1 0.22 -1.95
## Tapsh-14 14 1000 0.62 0.48 1 0.66 0 0 1 1 -0.52 -1.74
## Tapsh-15 15 1000 0.66 0.48 1 0.70 0 0 1 1 -0.66 -1.57
## Tapsh-16 16 1000 0.47 0.50 0 0.46 0 0 1 1 0.14 -1.98
## Tapsh-17 17 1000 0.53 0.50 1 0.54 0 0 1 1 -0.11 -1.99
## Tapsh-18 18 1000 0.34 0.47 0 0.30 0 0 1 1 0.68 -1.54
## Tapsh-19 19 1000 0.66 0.47 1 0.70 0 0 1 1 -0.67 -1.55
## Tapsh-20 20 1000 0.38 0.48 0 0.34 0 0 1 1 0.51 -1.74
## Tapsh-21 21 1000 0.58 0.49 1 0.60 0 0 1 1 -0.31 -1.91
## Tapsh-22 22 1000 0.75 0.43 1 0.81 0 0 1 1 -1.15 -0.69
## Tapsh-23 23 1000 0.50 0.50 0 0.50 0 0 1 1 0.02 -2.00
## Tapsh-24 24 1000 0.50 0.50 0 0.50 0 0 1 1 0.02 -2.00
## Tapsh-25 25 1000 0.54 0.50 1 0.55 0 0 1 1 -0.15 -1.98
## Tapsh-26 26 1000 0.59 0.49 1 0.62 0 0 1 1 -0.38 -1.86
## Tapsh-27 27 1000 0.74 0.44 1 0.80 0 0 1 1 -1.08 -0.83
## Tapsh-28 28 1000 0.42 0.49 0 0.39 0 0 1 1 0.34 -1.88
## Tapsh-29 29 1000 0.59 0.49 1 0.61 0 0 1 1 -0.36 -1.87
## Tapsh-30 30 1000 0.49 0.50 0 0.48 0 0 1 1 0.05 -2.00
## Tapsh-31 31 1000 0.40 0.49 0 0.38 0 0 1 1 0.39 -1.85
## Tapsh-32 32 1000 0.57 0.50 1 0.59 0 0 1 1 -0.29 -1.92
## Tapsh-33 33 1000 0.60 0.49 1 0.63 0 0 1 1 -0.42 -1.83
## Tapsh-34 34 1000 0.72 0.45 1 0.77 0 0 1 1 -0.97 -1.07
## Tapsh-35 35 1000 0.73 0.44 1 0.79 0 0 1 1 -1.04 -0.92
## Tapsh-36 36 1000 0.66 0.47 1 0.70 0 0 1 1 -0.67 -1.56
## Tapsh-37 37 1000 0.57 0.50 1 0.59 0 0 1 1 -0.28 -1.92
## Tapsh-38 38 1000 0.39 0.49 0 0.37 0 0 1 1 0.43 -1.81
## Tapsh-39 39 1000 0.67 0.47 1 0.72 0 0 1 1 -0.73 -1.47
## Tapsh-40 40 1000 0.31 0.46 0 0.26 0 0 1 1 0.82 -1.34
## se
## Tapsh-1 0.01
## Tapsh-2 0.02
## Tapsh-3 0.02
## Tapsh-4 0.02
## Tapsh-5 0.02
## Tapsh-6 0.01
## Tapsh-7 0.01
## Tapsh-8 0.01
## Tapsh-9 0.02
## Tapsh-10 0.01
## Tapsh-11 0.01
## Tapsh-12 0.02
## Tapsh-13 0.02
## Tapsh-14 0.02
## Tapsh-15 0.02
## Tapsh-16 0.02
## Tapsh-17 0.02
## Tapsh-18 0.01
## Tapsh-19 0.01
## Tapsh-20 0.02
## Tapsh-21 0.02
## Tapsh-22 0.01
## Tapsh-23 0.02
## Tapsh-24 0.02
## Tapsh-25 0.02
## Tapsh-26 0.02
## Tapsh-27 0.01
## Tapsh-28 0.02
## Tapsh-29 0.02
## Tapsh-30 0.02
## Tapsh-31 0.02
## Tapsh-32 0.02
## Tapsh-33 0.02
## Tapsh-34 0.01
## Tapsh-35 0.01
## Tapsh-36 0.02
## Tapsh-37 0.02
## Tapsh-38 0.02
## Tapsh-39 0.01
## Tapsh-40 0.01
## write.csv(Orta_data_3PL, file = "Orta.csv", row.names = FALSE)
Orta səviyyəli testin cəm ballarının paylanması.
## Combine in a data frame and create a scatterplot
Orta_Bal <- rowSums(Orta_data_3PL)
escores <- rnorm(length(Orta_Bal), 0, 1.4)
tscores <- setrange(Orta_Bal - escores, y = Orta_Bal)
Orta_scores <- data.frame(x1 = Orta_Bal, t = tscores,
e = escores)
P_orta <- ggplot(Orta_scores, aes(Orta_Bal, t)) +
geom_point(position = position_jitter(w = .3)) +
geom_abline(col = "blue",lwd =2)
P_orta
Çətin_3PL <- lsasim::item_gen(n_3pl = 40, b_bounds = c(0, 2),
a_bounds = c(.75, 1.25), c_bounds = c(0, .25))
Çətin_3PL_Tapş <- as.matrix(cbind(alpha = Çətin_3PL$a,
delta = Çətin_3PL$b,
chi = Çətin_3PL$c))
set.seed(1954)
Çətin_data_3PL <- irtoys::sim(ip = Çətin_3PL_Tapş, x = rnorm(1000,0,1))
colnames(Çətin_data_3PL) <- paste0("Tapsh", "-",1:40)
rownames(Çətin_data_3PL) <- paste0("Ish", "-",1:1000)
head(Çətin_data_3PL,4)
## Tapsh-1 Tapsh-2 Tapsh-3 Tapsh-4 Tapsh-5 Tapsh-6 Tapsh-7 Tapsh-8 Tapsh-9
## Ish-1 1 0 0 0 1 1 0 0 0
## Ish-2 1 0 0 0 0 0 1 0 1
## Ish-3 1 0 0 0 0 0 1 0 1
## Ish-4 1 0 1 0 1 1 1 1 1
## Tapsh-10 Tapsh-11 Tapsh-12 Tapsh-13 Tapsh-14 Tapsh-15 Tapsh-16 Tapsh-17
## Ish-1 0 0 1 0 1 1 0 0
## Ish-2 0 1 0 0 0 0 0 0
## Ish-3 1 1 0 0 0 1 0 1
## Ish-4 1 1 1 0 1 0 1 0
## Tapsh-18 Tapsh-19 Tapsh-20 Tapsh-21 Tapsh-22 Tapsh-23 Tapsh-24 Tapsh-25
## Ish-1 0 0 0 0 1 0 0 0
## Ish-2 0 0 0 0 0 0 0 0
## Ish-3 0 1 1 1 1 1 0 0
## Ish-4 0 1 1 0 1 1 1 0
## Tapsh-26 Tapsh-27 Tapsh-28 Tapsh-29 Tapsh-30 Tapsh-31 Tapsh-32 Tapsh-33
## Ish-1 1 0 0 0 0 0 0 1
## Ish-2 1 1 0 1 1 0 0 1
## Ish-3 1 1 0 1 0 0 0 0
## Ish-4 1 0 0 0 0 0 1 1
## Tapsh-34 Tapsh-35 Tapsh-36 Tapsh-37 Tapsh-38 Tapsh-39 Tapsh-40
## Ish-1 0 0 1 0 0 0 0
## Ish-2 1 0 1 0 0 1 0
## Ish-3 0 1 1 0 0 0 0
## Ish-4 1 1 0 0 1 0 1
describe(Çətin_data_3PL)
## vars n mean sd median trimmed mad min max range skew kurtosis
## Tapsh-1 1 1000 0.58 0.49 1 0.60 0 0 1 1 -0.34 -1.89
## Tapsh-2 2 1000 0.23 0.42 0 0.17 0 0 1 1 1.25 -0.44
## Tapsh-3 3 1000 0.34 0.47 0 0.30 0 0 1 1 0.69 -1.53
## Tapsh-4 4 1000 0.52 0.50 1 0.53 0 0 1 1 -0.08 -1.99
## Tapsh-5 5 1000 0.44 0.50 0 0.42 0 0 1 1 0.25 -1.94
## Tapsh-6 6 1000 0.54 0.50 1 0.55 0 0 1 1 -0.17 -1.97
## Tapsh-7 7 1000 0.55 0.50 1 0.57 0 0 1 1 -0.21 -1.96
## Tapsh-8 8 1000 0.51 0.50 1 0.51 0 0 1 1 -0.03 -2.00
## Tapsh-9 9 1000 0.40 0.49 0 0.37 0 0 1 1 0.43 -1.82
## Tapsh-10 10 1000 0.50 0.50 0 0.50 0 0 1 1 0.02 -2.00
## Tapsh-11 11 1000 0.55 0.50 1 0.56 0 0 1 1 -0.20 -1.96
## Tapsh-12 12 1000 0.36 0.48 0 0.32 0 0 1 1 0.60 -1.65
## Tapsh-13 13 1000 0.33 0.47 0 0.29 0 0 1 1 0.72 -1.49
## Tapsh-14 14 1000 0.47 0.50 0 0.46 0 0 1 1 0.14 -1.98
## Tapsh-15 15 1000 0.51 0.50 1 0.52 0 0 1 1 -0.05 -2.00
## Tapsh-16 16 1000 0.36 0.48 0 0.32 0 0 1 1 0.58 -1.66
## Tapsh-17 17 1000 0.35 0.48 0 0.31 0 0 1 1 0.62 -1.61
## Tapsh-18 18 1000 0.19 0.39 0 0.11 0 0 1 1 1.59 0.54
## Tapsh-19 19 1000 0.49 0.50 0 0.48 0 0 1 1 0.05 -2.00
## Tapsh-20 20 1000 0.20 0.40 0 0.12 0 0 1 1 1.54 0.36
## Tapsh-21 21 1000 0.40 0.49 0 0.37 0 0 1 1 0.43 -1.82
## Tapsh-22 22 1000 0.59 0.49 1 0.62 0 0 1 1 -0.38 -1.86
## Tapsh-23 23 1000 0.29 0.45 0 0.24 0 0 1 1 0.92 -1.15
## Tapsh-24 24 1000 0.33 0.47 0 0.29 0 0 1 1 0.70 -1.51
## Tapsh-25 25 1000 0.40 0.49 0 0.37 0 0 1 1 0.42 -1.82
## Tapsh-26 26 1000 0.42 0.49 0 0.39 0 0 1 1 0.34 -1.88
## Tapsh-27 27 1000 0.55 0.50 1 0.57 0 0 1 1 -0.21 -1.96
## Tapsh-28 28 1000 0.24 0.42 0 0.17 0 0 1 1 1.24 -0.46
## Tapsh-29 29 1000 0.45 0.50 0 0.44 0 0 1 1 0.18 -1.97
## Tapsh-30 30 1000 0.32 0.47 0 0.28 0 0 1 1 0.75 -1.44
## Tapsh-31 31 1000 0.23 0.42 0 0.17 0 0 1 1 1.25 -0.44
## Tapsh-32 32 1000 0.40 0.49 0 0.37 0 0 1 1 0.42 -1.83
## Tapsh-33 33 1000 0.46 0.50 0 0.45 0 0 1 1 0.17 -1.97
## Tapsh-34 34 1000 0.57 0.50 1 0.59 0 0 1 1 -0.28 -1.92
## Tapsh-35 35 1000 0.54 0.50 1 0.55 0 0 1 1 -0.16 -1.97
## Tapsh-36 36 1000 0.52 0.50 1 0.53 0 0 1 1 -0.08 -1.99
## Tapsh-37 37 1000 0.40 0.49 0 0.38 0 0 1 1 0.39 -1.85
## Tapsh-38 38 1000 0.24 0.43 0 0.18 0 0 1 1 1.20 -0.57
## Tapsh-39 39 1000 0.55 0.50 1 0.56 0 0 1 1 -0.20 -1.96
## Tapsh-40 40 1000 0.15 0.36 0 0.06 0 0 1 1 1.96 1.83
## se
## Tapsh-1 0.02
## Tapsh-2 0.01
## Tapsh-3 0.01
## Tapsh-4 0.02
## Tapsh-5 0.02
## Tapsh-6 0.02
## Tapsh-7 0.02
## Tapsh-8 0.02
## Tapsh-9 0.02
## Tapsh-10 0.02
## Tapsh-11 0.02
## Tapsh-12 0.02
## Tapsh-13 0.01
## Tapsh-14 0.02
## Tapsh-15 0.02
## Tapsh-16 0.02
## Tapsh-17 0.02
## Tapsh-18 0.01
## Tapsh-19 0.02
## Tapsh-20 0.01
## Tapsh-21 0.02
## Tapsh-22 0.02
## Tapsh-23 0.01
## Tapsh-24 0.01
## Tapsh-25 0.02
## Tapsh-26 0.02
## Tapsh-27 0.02
## Tapsh-28 0.01
## Tapsh-29 0.02
## Tapsh-30 0.01
## Tapsh-31 0.01
## Tapsh-32 0.02
## Tapsh-33 0.02
## Tapsh-34 0.02
## Tapsh-35 0.02
## Tapsh-36 0.02
## Tapsh-37 0.02
## Tapsh-38 0.01
## Tapsh-39 0.02
## Tapsh-40 0.01
## write.csv(Çətin_data_3PL, file = "Çətin.csv", row.names = FALSE)
Çətin testin cəm ballarının paylanmasını nümayişi.
### Combine in a data frame and create a scatterplot
Çətin_Bal <- rowSums(Çətin_data_3PL)
escores <- rnorm(length(Çətin_Bal), 0, 1.4)
tscores <- setrange(Çətin_Bal - escores, y = Çətin_Bal)
Çətin_scores <- data.frame(x1 = Çətin_Bal, t = tscores,
e = escores)
P_çətin <- ggplot(Çətin_scores, aes(Çətin_Bal, t)) +
geom_point(position = position_jitter(w = .3)) +
geom_abline(col = "blue",lwd =2)
P_çətin
Hər üç səviyyəli testin cəm ballarının paylanmasının bir yerdə verilməsi
library(patchwork)
P_asan + P_orta + P_çətin
Bu üç müxtəlif səviyyəli testlərin cəm ballarının paylanma qrafiklərinin bir yerdə verilməsində məqsəd, onların müqayisə olunabilməsini asanlaşdırmaqdır. Doğurdan da soldan birinci qrafik asan testin cəm ballarının paylanmasına aiddir. Burada qrafikdən göründüyü kimi, balların sıxlığı şkalanın sonuna yaxın hissədə daha çoxdur. Yəni, test nisbətən asan olduğundan iştirakçılar daha çox yüksək ballar alıblar.
Qalan qrafiklərdə orta səviyyəli testdə balların sıxlığı şkalanın ortasında, çətin testdə isə şkalanın aşağı hissəsində daha çoxdur. Başqa sözlə, törədilən testlərin cəm ballarının paylanması adlarına münasibdir.
https://cran.r-project.org/web/packages/CTT/CTT.pdf
http://cran.auckland.ac.nz/web/packages/itemanalysis/itemanalysis.pdf
“Introduction to Educational and Psychological Measurement Using R.html”
“Handbook of Educational Measurement and Psychometrics Using R By Christopher D. Desjardins, Okan Bulut”